Spark生态系统组件MLib的应用场景是?
A. 图结构数据的处理
B. 基于历史数据的交互式查询
C. 复杂的批量数据处理
D. 基于历史数据的数据挖掘
Scala具有以下哪几个主要特点?
A. Scala的优势是提供了REPL,提高程序开发效率
B. Scala兼容Java,运行速度快,且能融合到Hadoop生态圈中
C. Scala具备强大的并发性,支持函数式编程
D. Scala可以更好地支持分布式系统
下列说法中,哪些选项描述正确?
A. Spark在借鉴Hadoop MapReduce优点的同时,很好地解决了MapReduce所面临的问题
B. Spark的计算模式也属于MapReduce,但不局限于Map和Reduce操作
C. Hadoop MapReduce编程模型比Spark更灵活
D. Hadoop MapReduce提供了内存计算,可将中间结果放在内存中,对于迭代运算效率更高
在实际应用中,大数据处理主要包括一下那三个类型?
A. 复杂的批量数据处理:通常时间跨度在数十分钟到数小时之间
B. 基于历史数据的交互式查询:通常时间跨度在数十秒到数分钟之间
C. 基于实时数据流的数据处理:通常时间跨度在数十秒到数分钟之间
D. 基于实时数据流的数据处理:通常时间跨度在数百毫秒到数秒之间