下列哪些选项属于Hadoop的缺点?
A. 表达能力有限
B. 磁盘IO开销大
C. 延迟高
D. 在前一个任务执行完成之前,其他任务就无法开始,难以胜任复杂、多阶段的计算任务
下列说法中,哪些选项描述正确?
A. Spark在借鉴Hadoop MapReduce优点的同时,很好地解决了MapReduce所面临的问题
B. Spark的计算模式也属于MapReduce,但不局限于Map和Reduce操作
C. Hadoop MapReduce编程模型比Spark更灵活
D. Hadoop MapReduce提供了内存计算,可将中间结果放到内存中,对于迭代运算效率更高
在实际应用中,大数据处理主要包括以下哪三个类型?
A. 复杂的批量数据处理:通常时间跨度在数十分钟到数小时之间
B. 基于历史数据的交互式查询:通常时间跨度在数十秒到数分钟之间
C. 基于实时数据流的数据处理:通常时间跨度在数十秒到数分钟之间
D. 基于实时数据流的数据处理:通常时间跨度在数百毫秒到数秒之间
在实际应用中,当采用多种计算架构来满足不同应用场景需求时,大数据处理难免会带来哪些问题?
A. 不同场景之间输入输出数据无法做到无缝共享,通常需要进行数据格式的转换
B. 不同的软件需要不同的开发和维护团队
C. 需要较高的使用成本
D. 比较难以对同一个集群中的各个系统进行统一的资源协调和分配