A.獲取數(shù)據(jù),并將原始數(shù)據(jù)轉(zhuǎn)化成自己處理的數(shù)據(jù)對象
B.緩存數(shù)據(jù),根據(jù)不同的可靠性策略,將數(shù)據(jù)保存在內(nèi)存或文件上
C.輸出數(shù)據(jù)到目的地,支持多種輸出協(xié)議
D.拆分?jǐn)?shù)據(jù),根據(jù)數(shù)據(jù)的特性,將數(shù)據(jù)發(fā)送到不同的目的地
您可能感興趣的試卷
你可能感興趣的試題
A.分區(qū)字段要在創(chuàng)建表時定義
B.分區(qū)字段只能有一個,不可以創(chuàng)建多級分區(qū)
C.使用分區(qū),可以減少某些查詢的數(shù)據(jù)掃᧿范圍,進(jìn)而ᨀ高查詢效率
D.分區(qū)字段可以作為where字句的條件
A.優(yōu)先從最近的DataNode下載數(shù)據(jù)
B.文件數(shù)據(jù)先從DataNode返回至NameNode,然后從NameNode下致到客戶端
C.如果客戶端和所連接的DataNode在讀取時出現(xiàn)故障,那么客戶端會放棄這其他副本所在的節(jié)點
D.支持多個客戶端同時從DataNode上讀取同一個文件數(shù)據(jù)
最新試題
關(guān)于Kafka的Producer,如下說法正確的是?()
Fiume支持實時采集數(shù)據(jù)的source類型是哪項?()
在Spark應(yīng)用開發(fā)中,以下哪項的代碼能正確進(jìn)行單詞統(tǒng)計?()
Fusionlnsight HD關(guān)于Oozie的作業(yè)操作命令,下列哪幾項敘述是正確的?()
用戶要開發(fā)一個應(yīng)用去訪問HBase服務(wù),先申請了一個機機賬號teste1,并給它設(shè)置訪問HBase服務(wù)的權(quán)限:然后下載該賬戶的keytab文件,并使用該賬號運行應(yīng)用。后續(xù)此應(yīng)用增加業(yè)務(wù)需求,需訪問Hive服務(wù),那么在給tested用戶補充授予了訪問Hive組件權(quán)限后,需重新下載該用戶的keytab文件。()
Spark Streaming可以從Kafka接收數(shù)據(jù)并進(jìn)行計算,計算結(jié)果只能存入HDFS,不能再寫回Kafka。()
以下業(yè)務(wù)應(yīng)用中,哪個不是Hive適用的場景?()
FusionLnsigh HD,Oozie支持HDFS Action。()
由于Spark是基于內(nèi)存的計算引擎,因此,一個Spark應(yīng)用可以處理的數(shù)據(jù)量不能超過分給這個Spark應(yīng)用的內(nèi)存總和。()
在HBase表設(shè)計中,對于多項業(yè)務(wù)共用rowkey,導(dǎo)致數(shù)據(jù)訪問矛盾的情況,可以有哪些應(yīng)對策略?()