题目内容

在实际应用中,大数据处理主要包括哪几种类型:( )

A. 复杂的批量数据处理:时间跨度通常在数十分钟到数小时之间
B. 基于历史数据的交互式查询:时间跨度通常在数十秒到数分钟之间
C. 基于实时数据流的数据处理:时间跨度通常在数百毫秒到数秒之间
D. 基于历史数据的流查询:时间跨度在数十秒到数分钟之间

查看答案
更多问题

Spark的集群部署方式包括:( )

A. Spark on Mesos模式
B. Spark on YARN模式
C. Spark on Kubernetes模式
D. Local模式

Spark MLlib主要提供了哪几个方面的工具:( )

A. 算法工具
B. 特征化工具
C. 流水线
D. 实用工具

下面关于Storm框架设计描述正确的是:( )

A. Storm运行在分布式集群中,其运行任务的方式与Hadoop类似
B. 在Hadoop上运行的是MapReduce作业,而在Storm上运行的是“Topology”
C. Storm集群采用P2P架构
D. Storm采用了Zookeeper来作为分布式协调组件

下面关于Flink的描述正确的是:( )

A. Flink和Spark一样,都是基于磁盘的计算框架
B. 当全部运行在Hadoop YARN之上时,Flink的性能甚至还要略好于Spark
C. Flink的流计算性能和Storm差不多,可以支持毫秒级的响应
D. Spark的市场影响力和社区活跃度明显超过Flink

答案查题题库