相关考题
-
多项选择题
当前大数据技术的基础包括()。
A.分布式文件系统
B.分布式并行计算
C.关系型数据库
D.分布式数据库 -
多项选择题
关于Spark和Mapreduce,下列说法正确的是()。
A.性能上提升高于100倍(全内存计算)
B.Spark的中间数据放在内存中,对于迭代运算、批处理计算的效率更高,延迟更低。
C.提供更多的数据集操作类型,编程模型更灵活,开发效率更高。
D.更低的容错能力(血统机制)。
E.Spark用十分之一的资源,获得10倍与Mapreduce的性能。 -
多项选择题
下面关于行存储和列存储说法正确的是()。
A.行存储,数据按行存储在底层文件系统中。通常,每一行会被分配固定的空间。
B.列存储有利于增加/修改整行记录等操作;有利于整行数据的读取操作。
C.列存储整行读取时,可能需要多次I/O操作。
