A. Spark Streaming B. Structured Streaming C. Zookeeper D. GraphX
A. MLlib B. Spark Core C. Machine Leaning D. Spark SQL
A. Spark SQL B. Spark Core C. Spark Streaming D. Structured Streaming
A. 可扩展性 B. 可靠的消息处理 C. 支持各种编程语言 D. 复杂的API
A. 减少了所使用的编程语言的种类 B. 计算资源按需伸缩 C. 不用负载应用混搭,集群利用率高 D. 共享底层存储,避免数据跨集群迁移
A. 复杂的批量数据处理:时间跨度通常在数十分钟到数小时之间 B. 基于历史数据的交互式查询:时间跨度通常在数十秒到数分钟之间 C. 基于实时数据流的数据处理:时间跨度通常在数百毫秒到数秒之间 D. 基于历史数据的流查询:时间跨度在数十秒到数分钟之间
A. 微批处理 B. 高阶处理 C. 分层处理 D. 持续处理
A. 算法工具 B. 特征化工具 C. 流水线 D. 实用工具
A. JobManager B. TaskManager C. JobTracker D. TaskTracker