如果输入的特征中有一个是性别(1:男;0:女),而输出的特征是身高(1:高;0:矮)。那么当训练样本是一个个子高的男生的时候,在神经网络中,从“男“到“高”的路线就会被强化。同理如果来了一个个子高的女生,那从“女”到“高”的路线就会被强化。下列大数据组件中,以上场景哪个组件不能实现?
A. Spark
B.Hive
C. Flink
D. MaxCompute
查看答案
某开发者需要在大数据HDFS上存储测试数据,下面哪个命令可以用于创建HDFS测试目录/hdfstest/test的是?
A. hdfs dfs -mkdir /hdfstest/test
B. hdfs dfs -get /hdfstest/test
C. hdfs dfs -cat /hdfstest/test
D. hdfs dfs -rmdir /hdfstest/test
下列关于Hadoop生态的说法中正确的是
A. YARN以流式数据访问模式来存储超大文件; 可以实现次写入、多次读写
B. Hive支持随机读和几十毫秒级别的查询
C.HBase的主要功能是离线计算
D.MapReduce功能实现了将单个任务分解,并将拆解后的任务(Map)发送到多个节点上,之后再将分别计算的结果进行聚合汇总
2020年天猫双十一成交额4982亿元,最高峰值订单54.4万笔/秒,单日处理数据量达到970PB。这一现象体现了大数据什么特征?
A.数据量大
B.数据种类多
C.处理速度快
D.价值密度低
一家工厂现有1000名在职职工。但职工数据库显示了1001份不同的职工记录。其中两条记录除了名字王圆圆和王源源不同外其他字段如住址、联系方式等全部相同,可能是将该职工使用了曾用名。此案例体现了数据质量的哪一特性?
A.准确性
B.完整性
C.唯一性
D.J及时性