在实际应用中,大数据处理主要包括一下那三个类型?
A. 复杂的批量数据处理:通常时间跨度在数十分钟到数小时之间
B. 基于历史数据的交互式查询:通常时间跨度在数十秒到数分钟之间
C. 基于实时数据流的数据处理:通常时间跨度在数十秒到数分钟之间
D. 基于实时数据流的数据处理:通常时间跨度在数百毫秒到数秒之间
在实际应用中,当采用多种计算架构来满足不同应用场景需求时,大数据处理难免会带来哪些问题?
A. 不同场景之间输入输出数据能做到无缝共享,通常都需要进行数据格式的转换
B. 不同的软件需要不同的开发和维护团体
C. 需要较高的使用成本
D. 比较难以对同一个集群中的各个系统资源进行统一的资源协调和分配
与Hadoop MAPReduce计算框架相比,Spark所采用的Excutor具有哪些优点?
A. 利用多线程来执行具体的任务,减少任务的启动开销
B. Executor中有一个BlockManager存储模块,有效减少IO开销
C. 提供了一种高度受限的共享内存模型
D. 在不同场景之间输入输出数据能做到无缝共享
Spark支持哪三种不同类型的部署方式?
A. Standalone
B. Spark on Mesos
C. Spark on YARN
D. Spark on HDFS