A.其支持度小于閾值
B.都是不讓人感興趣的
C.包含負模式和負相關模式
D.對異常數(shù)據(jù)項敏感
您可能感興趣的試卷
你可能感興趣的試題
A.支持度閥值
B.項數(shù)(維度)
C.事務數(shù)
D.事務平均寬度
A.數(shù)據(jù)的抽取
B.存儲和管理
C.數(shù)據(jù)的表現(xiàn)
D.數(shù)據(jù)倉庫設計
A.數(shù)據(jù)倉庫就是數(shù)據(jù)庫
B.數(shù)據(jù)倉庫是一切商業(yè)智能系統(tǒng)的基礎
C.數(shù)據(jù)倉庫是面向業(yè)務的,支持聯(lián)機事務處理(OLTP)
D.數(shù)據(jù)倉庫支持決策而非事務處理
E.數(shù)據(jù)倉庫的主要目標就是幫助分析,做長期性的戰(zhàn)略制定
A.主成分分析
B.特征提取
C.奇異值分解
D.特征加權
E.離散化
A.連續(xù)性
B.維度
C.稀疏性
D.分辨率
E.相異性
最新試題
隨機梯度下降每次更新執(zhí)行的計算量少于批梯度下降。
當數(shù)據(jù)集標簽錯誤的數(shù)據(jù)點時,隨機森林通常比AdaBoost更好。
最大似然估計的一個缺點是,在某些情況下(例如,多項式分布),它可能會返回零的概率估計。
使決策樹更深將確保更好的擬合度,但會降低魯棒性。
根據(jù)數(shù)據(jù)科學家與數(shù)據(jù)工程師對于問題的理解并相互討論,然后確定需要收集數(shù)據(jù)的范圍以及種類,然后數(shù)據(jù)工程師使用數(shù)據(jù)收集工具,架構,甚至編程的形式來進行數(shù)據(jù)收集的工作,然后并把數(shù)據(jù)收集的數(shù)據(jù)放置到對應的存儲系統(tǒng)。
完整性,一致性,時效性,唯一性,有效性,準確性是衡量數(shù)據(jù)質量的六個維度指標。
經(jīng)常跟管理層打交道并進行有效地關于商業(yè)領域的討論有助于數(shù)據(jù)科學項目的成功。
管理員不需要驗證就可以訪問數(shù)據(jù)存儲系統(tǒng)中的任何數(shù)據(jù),這符合數(shù)據(jù)安全的要求。
數(shù)據(jù)收集中的拉模式需要通過定時的方式不斷地觸發(fā),才能源源不斷地獲取對應的數(shù)據(jù)。
訓練神經(jīng)網(wǎng)絡具有過度擬合訓練數(shù)據(jù)的潛在問題。