职工数据表中有一个反映职工受教育程度的特征列,其特征值包括:研究生、大学、高中、职高、其他。在预测职工离职率时要使用此特征列的数据,并且需将其值先转换为1(研究生)、2(大学)、3(高中)、4(职高)、5(其他),则此转换的实现步骤应该是( )右键连接上个节点到当前转换节点添加转换节点在当前转换节点的数据转换面板中,添加一个Choice、5个Constant右键连接5个Constant到Choice分别设置5个Constant的值为int型的1、2、3、4、5,保存设置结果o在左侧的转换结果中新增一个列,重命名该列,设置好数据类型,并将设置好的Choice连接到该列p在Choice中按题设要求进行转换设置
A. op
B. p o
C. po√
D. po
查看答案
按性别对职工数据集进行汇总统计时,需要对性别列进行哪个操作才能完成统计汇总?( )
A. 分组
B. 聚合
C. 排列
D. 统计
全链路大数据分析流程包括六个步骤,这六个步骤的排列顺序是( )
A. 数据汇集à数据源à数据湖à分析挖掘à数据加工à数据可视化
B. 数据汇集à数据源à分析挖掘à数据湖à数据加工à数据可视化
C. 数据源à数据汇集à分析挖掘à数据湖à数据加工à数据可视化
D. 数据源à数据汇集à数据湖à数据加工à分析挖掘à数据可视化
已知两个同类企业职工平均工资的标准差分别为 :甲=5元,乙=6元,则两个企业职工平均工工资的代表性是()
A. 甲大于乙
B. 乙大于甲
C. 一样大
D. 无法判断
统计学中简单分组和符合分组的区别在于( )
A. 选择分组标志的性质不同
B. 组数的多少不同
C. 选择分组标志的多少不同
D. 总体的复杂程度不同