单项选择题
在RDD的转换算子中,用于将每个元素传递到函数func中,并将结果返回为一个新的数据集的转换算子是()。
A.filter()
B.groupByKey()
C.reduceByKey()
D.map()
点击查看答案&解析
相关考题
-
单项选择题
下列选项,不属于集群管理器的有()。
A.Hadoop Yarn
B.Apache Mesos
C.Local
D.Spark自带的独立调度器 -
单项选择题
在RDD的转换算子中,主要用于(Key,Value)键值对的数据集,将具有相同Key的Value进行分组,会返回一个新的(Key,Iterable)形式的数据集的转换算子是()。
A.filter()
B.groupByKey()
C.reduceByKey()
D.map() -
单项选择题
Spark与Hadoop在基于内存的运算中,说法正确的是()。
A.Spark的运算效率是Hadoop的10倍
B.Spark的运算效率是Hadoop的100倍
C.Hadoop的运算效率是Spark的100倍
D.Hadoop的运算效率是Spark的10倍
