题目内容

在实际应用中,大数据处理主要包括以下哪三个类型?

A. 复杂的批量数据处理:通常时间跨度在数十分钟到数小时之间
B. 基于历史数据的交互式查询:通常时间跨度在数十秒到数分钟之间
C. 基于实时数据流的数据处理:通常时间跨度在数十秒到数分钟之间
D. 基于实时数据流的数据处理:通常时间跨度在数百毫秒到数秒之间

查看答案
更多问题

在实际应用中,当采用多种计算架构来满足不同应用场景需求时,大数据处理难免会带来哪些问题?

A. 不同场景之间输入输出数据无法做到无缝共享,通常需要进行数据格式的转换
B. 不同的软件需要不同的开发和维护团队
C. 需要较高的使用成本
D. 比较难以对同一个集群中的各个系统进行统一的资源协调和分配

与Hadoop MapReduce计算框架相比,Spark所采用的Executor具有哪些优点?

A. 利用多线程来执行具体的任务,减少任务的启动开销
B. Executor中有一个BlockManager存储模块,有效减少IO开销
C. 提供了一种高度受限的共享内存模型
D. 不同场景之间输入输出数据能做到无缝共享

Spark运行架构具有以下哪些特点?

A. 每个Application都有自己专属的Executor进程,并且该进程在Application运行期间一直驻留
B. Executor进程以多线程的方式运行Task
C. Spark运行过程与资源管理器无关,只要能够获取Executor进程并保持通信即可
D. Task采用了数据本地性和推测执行等优化机制

Spark采用RDD以后能够实现高效计算的原因主要在于?

A. 高效的容错性
B. 中间结果持久化到内存,数据在内存中的多个
C. 存放的数据可以是Java对象,避免了不必要的对象序列化和反序列化
D. 采用数据复制实现容错

答案查题题库