A. 运行速度快 B. 容易使用 C. 通用性 D. 运行模式单一
A. Scala的优势是提供了REPL(Read-Eval-Print Loop,交互式解释器),提高程序开发效率 B. Scala兼容Java,运行速度快,且能融合到Hadoop生态圈中 C. Scala具备强大的并发性,支持函数式编程 D. Scala可以更好地支持分布式系统
A. 表达能力有限 B. 磁盘IO开销大 C. 延迟高 D. 在前一个任务执行完成之前,其他任务就无法开始,难以胜任复杂、多阶段的计算任务
A. Spark在借鉴Hadoop MapReduce优点的同时,很好地解决了MapReduce所面临的问题 B. Spark的计算模式也属于MapReduce,但不局限于Map和Reduce操作 C. Hadoop MapReduce编程模型比Spark更灵活 D. Hadoop MapReduce提供了内存计算,可将中间结果放到内存中,对于迭代运算效率更高
A. 复杂的批量数据处理:通常时间跨度在数十分钟到数小时之间 B. 基于历史数据的交互式查询:通常时间跨度在数十秒到数分钟之间 C. 基于实时数据流的数据处理:通常时间跨度在数十秒到数分钟之间 D. 基于实时数据流的数据处理:通常时间跨度在数百毫秒到数秒之间
A. 不同场景之间输入输出数据无法做到无缝共享,通常需要进行数据格式的转换 B. 不同的软件需要不同的开发和维护团队 C. 需要较高的使用成本 D. 比较难以对同一个集群中的各个系统进行统一的资源协调和分配
A. 利用多线程来执行具体的任务,减少任务的启动开销 B. Executor中有一个BlockManager存储模块,有效减少IO开销 C. 提供了一种高度受限的共享内存模型 D. 不同场景之间输入输出数据能做到无缝共享
A. 每个Application都有自己专属的Executor进程,并且该进程在Application运行期间一直驻留 B. Executor进程以多线程的方式运行Task C. Spark运行过程与资源管理器无关,只要能够获取Executor进程并保持通信即可 D. Task采用了数据本地性和推测执行等优化机制
A. 高效的容错性 B. 中间结果持久化到内存,数据在内存中的多个 C. 存放的数据可以是Java对象,避免了不必要的对象序列化和反序列化 D. 采用数据复制实现容错
A. Standalone(类似于MapReduce1.0,slot为资源分配单位) B. Spark on Mesos(和Spark有血缘关系,更好支持Mesos) C. Spark on YARN D. Spark on HDFS第十一章 流计算单选题