单选题以下哪种情况容易引发 HDFS 负载不均问题?
A. HDFS 中存储的文件大小不一,小文件太多
B. Data 各数据节点磁盘规格和空间大小有差异
C. NameNode 与 DataNode 节点在同一物理服务器上
D. HDFS 中 Block 的大小设置不合理
查看答案
单选题数据来源评估一般在( )阶段进行
A. 数据应用
B. 项目设计
C. 项目规划
D. 数据治理
单选题以下对 Flume 架构描述不正确的是
A. Channel 作为一个数据缓冲区会临时存放一些数据
B. Flume 的核心就是 Agent
C. Source 接收到数据之后,将数据发送给 Sink
D. Sink 负责将数据发送到外部指定的目的地
单选题大数据存储是指用存储器,以( )的形式,存储采集到数据的过程。
A. 数据库/数据仓库
B. 集群
C. 信息系统
D. 文件系统
单选题下列哪一个是 HADOOP HA 启动的第一个进程
A. 在 master1 上执行命令,启动 hdfs 和 yarn
B. 启动 zookeeper
C. 启动 journalnode
D. 在 master2 上执行命令,启动 yarn