A. MapReduce B. HDFS C. ETL D. Spark
A. Hadoop、Spark均未内置交互式处理架构 B. 几乎都支持类似SQL语言进行查询 C. SQL是非结构化查询语言 D. 采用的查询语言与SQL截然不同
A. 历史批量数据 B. 交互式查询 C. 批量小数据集 D. 实时海量数据集
A. 内存 B. 外存 C. 硬盘 D. U盘
A. MapReduce B. Spark Core C. Spark SQL D. MLlib
A. 流式处理框架 B. 批处理框架 C. 交互式处理框架 D. 非交互式处理框架
A. 批处理框架用于计算大容量的、在线的数据集 B. 批处理框架用于计算大容量的、静态的数据集 C. 批处理框架用于计算持久存放在存储系统中的数据集 D. 批处理框架用于对历史数据进行分析,通常应用于对处理时间要求较高的场合
A. 流式处理框架将不同数据源的数据进行离线处理,获得价值 B. 流式处理框架将不同数据源的数据进行实时处理,获得价值 C. 流式处理框架无需针对整个数据集,而是通过系统传输每个数据项执行操作 D. 流式处理框架适用于数据随时间变化快,要求秒级响应的场景
A. 表达能力受限 B. 延时低 C. 延时高 D. 磁盘IO开销小
A. 分而治之,计算向数据靠拢 B. 运行速度快 C. 易使用,通用性强 D. 运行模式多样