医疗健康网站上公开的患者问诊数据最合适采用以下哪种方式采集()
A. 服务器日志
B. 传感器
C. 手动下载
D. 爬虫工具
查看答案
为避免因不同属性间度量值相差过大,而影响属性对分析结果的权重,而采用的数据预处理方法是()
A. 0-1标准化
B. 数据概化
C. 数据集成
D. 数据清洗
下列关于数据采集的方法说法正确的是( )?
A. 日志文件是由数据源系统自动生成的记录文件,以指定的文件格式记录活动。
B. 传感器能感受到被测量的信息并能将感受到的信息按一定规律变换成为电信号或其他所需形式的信息输出。
C. 网络爬虫可以代替人们自动地在互联网中进行数据信息的采集与整理。
D. Python与C++相比,代码更简洁,适合非专业编程人员入手。
以下对缺失值可能的处理方法有()
A. 丢弃缺失数据的记录
B. 平均值填充
C. 众数填充
D. 回归填充
网络上所有的数据都可以用网络爬虫工具爬取。
A. 对
B. 错