MapReduce中Map过程输出的键值对,将有下列哪个组件()进行合并处理。
A. Mapper
B. InputFormat
C. Reducer
D. OutputFormat
查看答案
Hive的分区操作关键字是下列哪项()
A. Group by
B. Join
C. Partition
D. Union
下列选项中,Flume的()组件用于源数据的采集。
A. Source
B. Channel
C. Sink
D. Watch
()是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。
A. 数据挖掘
B. 图像处理
C. 数据可视化
D. 机器学习
以下属于聚类算法的是()
A. K-means
B. 决策树
C. 朴素贝叶斯
D. 关联规则