()是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统
A. HBase
B. Hive
C. HDFS
D. YARN
查看答案
()是一个用于生产ECharts图表的类库,是一款将Python与ECharts相结合的强大的数据可视化工具。
A. Matplotlib
B. Tableau
C. pyecharts
D. ECharts
()是有目的地进行收集、整理、加工和分析数据,提炼有价值信息的过程。
()的目的在于提高数据质量,将脏数据清洗干净,使原数据具有完整性、唯一性、权威性、合法性、一致性等特点。
Spark继承了()分布 式计算的优点,同时也弥补了它的缺陷。