题目内容

下列属于数据采集解决的工具的是

A. ETL工具
B. SVM
C. SPARK
D. Kmeans

查看答案
更多问题

数据清洗与预处理阶段的工作主要是:

A. 使用工具对数据进行分类汇总,通过数据来挖掘数据背后的联系,分析原因,找出规律,然后应用到实际业务中。
B. 数据去重,异常处理,数据归一化等
C. 直观地展现大数据的特点
D. 抽取分布的,异构数据源中的数据到临时文件或者数据库中。

下列属于并行计算的描述是

A. 每个处理器都有独享的内存,数据交换通过网络完成
B. 处理器共享内存
C. 处理器共享同一IP地址
D. 处理器有独立的硬盘存储

下列不属于分布式文件系统的是

A. GFS
B. HDFS
Ceph
D. FAT

不属于分布式数据库的是

A. HBase
B. MongoDB
C. MySQL
D. ScaleBase

答案查题题库