A. 数据种类多 B. 价值密度高 C. 数据体量大 D. 处理速度快
A. configuration.xsl B. hadoop-site.xml C. hadoop-default.xml D. hadoop-env.sh
A. HDFS 中存储的文件大小不一,小文件太多 B. Data 各数据节点磁盘规格和空间大小有差异 C. NameNode 与 DataNode 节点在同一物理服务器上 D. HDFS 中 Block 的大小设置不合理
A. 数据应用 B. 项目设计 C. 项目规划 D. 数据治理
A. Channel 作为一个数据缓冲区会临时存放一些数据 B. Flume 的核心就是 Agent C. Source 接收到数据之后,将数据发送给 Sink D. Sink 负责将数据发送到外部指定的目的地
A. 数据库/数据仓库 B. 集群 C. 信息系统 D. 文件系统
A. 在 master1 上执行命令,启动 hdfs 和 yarn B. 启动 zookeeper C. 启动 journalnode D. 在 master2 上执行命令,启动 yarn
A. 支持 DataEngine Hadoop 和 MPP 分布式数据库等主流大数据平台 B. 采用 B/S 架构,纯 Java 语言开发,支持所有可部署 JDK 的操作系统 C. 只支持部分有 JDBC 接口的数据库 D. 具有分布式分析能力,可快速实现数据可视化分析
A. nc B. sn C. sc D. cc
A. 数据在节点存储上分布不均 B. Hive 中表数量的多少 C. 运算中 Key 值分布不均 D. 业务数据本身存在分布不均