(1)定義在一個(gè)數(shù)據(jù)集中什么數(shù)據(jù)是不一致或者離群的數(shù)據(jù)。
(2)找出所定義的離群點(diǎn)的有效挖掘方法。
下表所示的相依表匯總了超級(jí)市場(chǎng)的事務(wù)數(shù)據(jù)。其中hot dogs指包含熱狗的事務(wù),指不包含熱狗的事務(wù)。hamburgers指包含漢堡的事務(wù),
指不包含漢堡的事務(wù)。
假設(shè)挖掘出的關(guān)聯(lián)規(guī)則是“hot dogs=>hamburgers”。給定最小支持度閾值25%和最小置信度閾值50%,這個(gè)關(guān)聯(lián)規(guī)則是強(qiáng)規(guī)則嗎?
計(jì)算關(guān)聯(lián)規(guī)則“hot dogs=>hamburgers”的提升度,能夠說(shuō)明什么問(wèn)題?購(gòu)買熱狗和購(gòu)買漢堡是獨(dú)立的嗎?如果不是,兩者間存在哪種相關(guān)關(guān)系?