建立一个模型,根据已知的多个变量值来预测其他某个变量值,这属于机器学习的哪一类任务()
A. 分类规则
B. 回归分析
C. 聚类
D. 信息检索
查看答案
分析某网上客户的购买数据后发现,购买数据挖掘书籍的用户同时还会买大数据方面的书籍,这个问题可用以下哪种机器学习方法分析()
A. 关联分析
B. 聚类
C. 文本处理
D. 贝叶斯分类
下列有关数据质量说法错误的是()
A. 错误的数据将可能产生有害于决策的结果
B. 数据量很大时,数据质量差对机器学习没多大影响
C. 数据预处理的重要目的是提高机器学习结果的质量
D. 从业务系统提取的脏数据需要预处理才能进行建模
下列有关机器学习项目实施过程说法错误的是()
A. 合适的机器学习算法在分析前一般很难确定
B. 这是数据分析师的工作,不需要用户参加
C. 很多机器学习工具的使用遵循一定的机器学习步骤
D. 机器学习项目实施过程并不简单
下列关于特征编码的叙述错误的是( )
A. One-Hot编码适用于离散特征的取值之间没有大小顺序的情况
B. 若离散特征的取值有大小顺序,那么就可以使用数值与特征的映射来对特征进行编码
C. One-Hot编码解决了分类器不好处理属性数据的问题,在一定程度上也起到了扩充特征的作用
D. One-Hot编码将有k个不同取值的特征转化为k-1个特征