超星 - spark单元测试

多选题

Spark具有以下哪几个主要特点?

A. 运行速度快
B. 容易使用
C. 通用性
D. 运行模式单一

多选题

Scala具有以下哪几个主要特点?

A. Scala的优势是提供了REPL(Read-Eval-Print Loop,交互式解释器),提高程序开发效率
B. Scala兼容Java,运行速度快,且能融合到Hadoop生态圈中
C. Scala具备强大的并发性,支持函数式编程
D. Scala可以更好地支持分布式系统

查看答案

多选题

下列哪些选项属于Hadoop的缺点?

A. 表达能力有限
B. 磁盘IO开销大
C. 延迟高
D. 在前一个任务执行完成之前,其他任务就无法开始,难以胜任复杂、多阶段的计算任务

查看答案

多选题

下列说法中,哪些选项描述正确?

A. Spark在借鉴Hadoop MapReduce优点的同时,很好地解决了MapReduce所面临的问题
B. Spark的计算模式也属于MapReduce,但不局限于Map和Reduce操作
C. Hadoop MapReduce编程模型比Spark更灵活
D. Hadoop MapReduce提供了内存计算,可将中间结果放到内存中,对于迭代运算效率更高

查看答案

多选题

在实际应用中,大数据处理主要包括以下哪三个类型?

A. 复杂的批量数据处理:通常时间跨度在数十分钟到数小时之间
B. 基于历史数据的交互式查询:通常时间跨度在数十秒到数分钟之间
C. 基于实时数据流的数据处理:通常时间跨度在数十秒到数分钟之间
D. 基于实时数据流的数据处理:通常时间跨度在数百毫秒到数秒之间

查看答案

多选题

在实际应用中,当采用多种计算架构来满足不同应用场景需求时,大数据处理难免会带来哪些问题?

A. 不同场景之间输入输出数据无法做到无缝共享,通常需要进行数据格式的转换
B. 不同的软件需要不同的开发和维护团队
C. 需要较高的使用成本
D. 比较难以对同一个集群中的各个系统进行统一的资源协调和分配

查看答案

多选题

与Hadoop MapReduce计算框架相比,Spark所采用的Executor具有哪些优点?

A. 利用多线程来执行具体的任务,减少任务的启动开销
B. Executor中有一个BlockManager存储模块,有效减少IO开销
C. 提供了一种高度受限的共享内存模型
D. 不同场景之间输入输出数据能做到无缝共享

查看答案

多选题

Spark运行架构具有以下哪些特点?

A. 每个Application都有自己专属的Executor进程,并且该进程在Application运行期间一直驻留
B. Executor进程以多线程的方式运行Task
C. Spark运行过程与资源管理器无关,只要能够获取Executor进程并保持通信即可
D. Task采用了数据本地性和推测执行等优化机制

查看答案

多选题

Spark采用RDD以后能够实现高效计算的原因主要在于?

A. 高效的容错性
B. 中间结果持久化到内存,数据在内存中的多个
C. 存放的数据可以是Java对象,避免了不必要的对象序列化和反序列化
D. 采用数据复制实现容错

查看答案

多选题

Spark支持哪三种不同类型的部署方式?

A. Standalone(类似于MapReduce1.0,slot为资源分配单位)
B. Spark on Mesos(和Spark有血缘关系,更好支持Mesos)
C. Spark on YARN
D. Spark on HDFS第十一章流计算单选题

查看答案