A.設(shè)備異常
B.命名規(guī)則的不一致
C.與其他已有數(shù)據(jù)不一致而被刪除
D.在輸入時(shí),有些數(shù)據(jù)因?yàn)榈貌坏街匾暥鴽]有被輸入
您可能感興趣的試卷
你可能感興趣的試題
A.數(shù)據(jù)中的空缺值
B.噪聲數(shù)據(jù)
C.數(shù)據(jù)中的不一致性
D.數(shù)據(jù)中的概念分層
A.平滑
B.聚集
C.數(shù)據(jù)概化
D.規(guī)范化
A.數(shù)據(jù)清理
B.數(shù)據(jù)集成
C.數(shù)據(jù)變換
D.數(shù)據(jù)歸約
A.去掉數(shù)據(jù)中的噪聲
B.對(duì)數(shù)據(jù)進(jìn)行匯總和聚集
C.使用概念分層,用高層次概念替換低層次“原始”數(shù)據(jù)
D.將屬性按比例縮放,使之落入一個(gè)小的特定區(qū)間
A.填補(bǔ)數(shù)據(jù)種的空缺值
B.集成多個(gè)數(shù)據(jù)源的數(shù)據(jù)
C.得到數(shù)據(jù)集的壓縮表示
D.規(guī)范化數(shù)據(jù)
最新試題
最大似然估計(jì)的一個(gè)缺點(diǎn)是,在某些情況下(例如,多項(xiàng)式分布),它可能會(huì)返回零的概率估計(jì)。
要將工作申請(qǐng)分為兩類,并使用密度估計(jì)來檢測(cè)離職申請(qǐng)人,我們可以使用生成分類器。
對(duì)于文本數(shù)據(jù)和多媒體數(shù)據(jù)進(jìn)行特征提取是為了方便對(duì)于這類數(shù)據(jù)的觀察和理解。
使用偏差較小的模型總是比偏差較大的模型更好。
當(dāng)MAP中使用的先驗(yàn)是參數(shù)空間上的統(tǒng)一先驗(yàn)時(shí),MAP估計(jì)等于ML估計(jì)。
管理員不需要驗(yàn)證就可以訪問數(shù)據(jù)存儲(chǔ)系統(tǒng)中的任何數(shù)據(jù),這符合數(shù)據(jù)安全的要求。
數(shù)據(jù)存儲(chǔ)體系中并不牽扯計(jì)算機(jī)網(wǎng)絡(luò)這一環(huán)節(jié)。
根據(jù)數(shù)據(jù)科學(xué)家與數(shù)據(jù)工程師對(duì)于問題的理解并相互討論,然后確定需要收集數(shù)據(jù)的范圍以及種類,然后數(shù)據(jù)工程師使用數(shù)據(jù)收集工具,架構(gòu),甚至編程的形式來進(jìn)行數(shù)據(jù)收集的工作,然后并把數(shù)據(jù)收集的數(shù)據(jù)放置到對(duì)應(yīng)的存儲(chǔ)系統(tǒng)。
隨機(jī)梯度下降每次更新執(zhí)行的計(jì)算量少于批梯度下降。
給定用于2類分類問題的線性可分離數(shù)據(jù)集,線性SVM優(yōu)于感知器,因?yàn)镾VM通常能夠在訓(xùn)練集上實(shí)現(xiàn)更好的分類精度。