题目内容

Spark生态系统组件MLib的应用场景是?

A. 图结构数据的处理
B. 基于历史数据的交互式查询
C. 复杂的批量数据处理
D. 基于历史数据的数据挖掘

查看答案
更多问题

Scala具有以下哪几个主要特点?

A. Scala的优势是提供了REPL,提高程序开发效率
B. Scala兼容Java,运行速度快,且能融合到Hadoop生态圈中
C. Scala具备强大的并发性,支持函数式编程
D. Scala可以更好地支持分布式系统

下列说法中,哪些选项描述正确?

A. Spark在借鉴Hadoop MapReduce优点的同时,很好地解决了MapReduce所面临的问题
B. Spark的计算模式也属于MapReduce,但不局限于Map和Reduce操作
C. Hadoop MapReduce编程模型比Spark更灵活
D. Hadoop MapReduce提供了内存计算,可将中间结果放在内存中,对于迭代运算效率更高

在实际应用中,大数据处理主要包括一下那三个类型?

A. 复杂的批量数据处理:通常时间跨度在数十分钟到数小时之间
B. 基于历史数据的交互式查询:通常时间跨度在数十秒到数分钟之间
C. 基于实时数据流的数据处理:通常时间跨度在数十秒到数分钟之间
D. 基于实时数据流的数据处理:通常时间跨度在数百毫秒到数秒之间

在实际应用中,当采用多种计算架构来满足不同应用场景需求时,大数据处理难免会带来哪些问题?

A. 不同场景之间输入输出数据能做到无缝共享,通常都需要进行数据格式的转换
B. 不同的软件需要不同的开发和维护团体
C. 需要较高的使用成本
D. 比较难以对同一个集群中的各个系统资源进行统一的资源协调和分配

答案查题题库