A.RDD(Resilient distributed dataset)叫做彈性分布式數(shù)據(jù)集,是spark中最基本的數(shù)據(jù)抽象
B.Resilient:表示彈性的,彈性表示
C.Destributed:分布式,可以并行在集群計算
D.Dataset:就是一個集合,用于存放數(shù)據(jù)的
您可能感興趣的試卷
你可能感興趣的試題
A.mapPartitions
B.lookup
C.mapPartitionsWithIndex
D.count
A.寬依賴
B.窄依賴
C.分區(qū)關(guān)系
D.繼承關(guān)系
A."Hello"(0),"Hello"(5)
B."Hello".take(1),"Hello".reverse(0)
C."Hello"(1),"Hello"(5)
D."Hello".take(0), "Hello".takeRight(1)
A.import scala.math._
B.import sqrt
C.import math._
D.import math.sqrt
A.1
B.2
C.3
D.4
最新試題
下列哪些是HDFS中的進程的名字?()
為了查看不斷更新的日志文件,可以使用的指令是()。
下面的對象創(chuàng)建方法中哪些會調(diào)用構(gòu)造方法()。
scala中定義一個空的list應(yīng)該選擇下列哪個類型()。
關(guān)于Java的抽象類、接口,以下描述錯誤的是()。
在DOS中一個java類的編譯命令是()。
關(guān)于HDFS中WEBUI的端口是什么?()
寬依賴的算子有()。
分析下列方法,在調(diào)用div(1,0)和div(1,1)后分別反回什么?()
如果我們現(xiàn)有一個安裝2.6.5版本的hadoop集群,在不修改默認配置的情況下存儲200個每個200M的文本文件,請問最終會在集群中產(chǎn)生多少個數(shù)據(jù)塊(包括副本)?()