不同的计算框架统一运行在YARN中,可以带来的好处包括( )。
A. 减少了所使用的编程语言的种类
B. 计算资源按需伸缩
C. 不用负载应用混搭,集群利用率高
D. 共享底层存储,避免数据跨集群迁移
在实际应用中,大数据处理主要包括的类型有( )。
A. 复杂的批量数据处理:时间跨度通常在数十分钟到数小时之间
B. 基于历史数据的交互式查询:时间跨度通常在数十秒到数分钟之间
C. 基于实时数据流的数据处理:时间跨度通常在数百毫秒到数秒之间
D. 基于历史数据的流查询:时间跨度在数十秒到数分钟之间
Structured Streaming包括的两种处理模型是( )。
A. 微批处理
B. 高阶处理
C. 分层处理
D. 持续处理
Spark MLlib主要提供的工具包括( )。
A. 算法工具
B. 特征化工具
C. 流水线
D. 实用工具