A.map
B.reduce
C.partitionBy
D.key by
您可能感興趣的試卷
你可能感興趣的試題
A.jobmanager
B.TaskManager
C.master
D.StandaloneSessionClusterEntrypoint
A.Tumbling Window(滾動窗口)
B.Sliding Window(滑動窗口)
C.Session Window(會話窗口)
D.Local Window(局部窗口)
A.local
B.standalone
C.yarn
D.mesos
A.RDD(Resilient distributed dataset)叫做彈性分布式數據集,是spark中最基本的數據抽象
B.Resilient:表示彈性的,彈性表示
C.Destributed:分布式,可以并行在集群計算
D.Dataset:就是一個集合,用于存放數據的
A.mapPartitions
B.lookup
C.mapPartitionsWithIndex
D.count
最新試題
spark中的寬窄依賴描述正確的()。
在使用MapReduce程序WordCount進行詞頻統(tǒng)計時,對于文本*行“hello hadoop hello world”,經過WordCount程序的Map函數處理后直接輸出的中間結果,應該是下面哪種形式:()。
下列哪些是HDFS中的進程的名字?()
下列代碼的運行結果是()。
關于HDFS集群中的DataNode的描述不正確的是()。
scala中在REPL命令行運行以下操作:下列選項正確的是()。
一個以java為后綴的源文件()。
如果我們現(xiàn)有一個安裝2.6.5版本的hadoop集群,在不修改默認配置的情況下存儲200個每個200M的文本文件,請問最終會在集群中產生多少個數據塊(包括副本)?()
如何將root目錄下file.tar.gz文件解壓到/usr/local目錄下。()
在DOS中一個java類的編譯命令是()。