存在如下業(yè)務(wù)場(chǎng)景:用戶上網(wǎng)日志文件已經(jīng)存放在HDFS上,日志文件內(nèi)容格式是:每條上網(wǎng)記錄三個(gè)字段,分別是姓名,性別,上網(wǎng)時(shí)間,字段之間用“,”護(hù)分隔;要求打印輸出所有上網(wǎng)總時(shí)間大于兩小時(shí)的女性網(wǎng)友。請(qǐng)問如下哪些代碼片段能實(shí)現(xiàn)上述業(yè)務(wù)場(chǎng)景?()
A.A
B.B
C.C
D.D
您可能感興趣的試卷
你可能感興趣的試題
A.Producer負(fù)責(zé)生產(chǎn)數(shù)據(jù),Consumer負(fù)責(zé)消費(fèi)數(shù)據(jù),Producer和Consumer之間需要建立Socket鏈接
B.Producer既可以發(fā)送數(shù)據(jù)到Broker上,又可以發(fā)送數(shù)據(jù)到Consumer上
C.Producer作為消息生產(chǎn)者,可以直接將數(shù)據(jù)寫入Zookeeper
D.Producer連接任意一個(gè)正常的Broker實(shí)例就可以生產(chǎn)數(shù)據(jù)
A.必須對(duì)查詢字段進(jìn)行排序
B.必須對(duì)uniqueKey字段進(jìn)行排序
C.第一次查詢請(qǐng)求時(shí),需指定查詢參數(shù),操作方法如下,solrQuery.set(CursorMarkParams.CURSOR_MARK_PARAMCursorMarkParams.CURSOR_MARK_START)
D.查詢時(shí),請(qǐng)求中不能帶有start參數(shù),Solr的返回結(jié)果中會(huì)有nextCursorMark,在下次調(diào)動(dòng)使用這個(gè)值為oursorMark
A.valcounts=textFile.map(line=>line.split(“”)).map(-rd=>(word,1)).reduceByKey(_+_)
B.valcounts=textFile.flatMap(line=>line.split(“”)).map(word=>(word,1)).reduceByKey(_+_)
C.valcounts=textFile.map(line=>line.split(“”)).map(word=>(word,1)).groupByKey(_+_)
D.valcounts=textFile.flatMap(line=>line.split(“”)).map(word=>(word,1)).groupByKey(_+_)
最新試題
Fusionlnsight HD支持通過哪些方式ᨀ交Oozie作業(yè)?()
關(guān)于Kafka的Producer,如下說法正確的是?()
Fusionlnsight HD中,關(guān)于Hive的數(shù)據(jù)加載功能(通過Hivede LOAD命令導(dǎo)入數(shù)據(jù)),以下敘述錯(cuò)誤的是?()
Spark Streaming可以從Kafka接收數(shù)據(jù)并進(jìn)行計(jì)算,計(jì)算結(jié)果只能存入HDFS,不能再寫回Kafka。()
Redis不適用與下面那些場(chǎng)景?()
Fusionlnsight HD中,一個(gè)部署在Tomcat上的應(yīng)用,需訪問HBase服務(wù),這種場(chǎng)景下推薦使用機(jī)機(jī)賬號(hào)。()
Fusionlnsight HD中,屬于Streaming的數(shù)據(jù)分發(fā)方式有哪些?()
Fusionlnsigt HD的Hive組件可以運(yùn)行在哪些分布式計(jì)算機(jī)框架上?()
在Kafka中,關(guān)于Consumer說法正確的是()。
Oozie的workflow.xml文件是工作流配置文件。()