题目内容

如果数据服从正态分布,在3σ原则下,异常值被定义为一组测定值中与平均值的偏差超过三倍标准差的值。在正态分布的假设下,距离平均值 3σ之外的值出现的概率<=0.003 ,属于极个别的小概率事件。

A. 对
B. 错

查看答案
更多问题

平均水平的指标是对个体集中趋势的度量,使用最广泛的是均值和中位数;反映变异程度的指标则是对个体离开平均水平的度量,使用较广泛的是标准差(方差)、四分位间距。

A. 对
B. 错

预测主要是预测分类标号(离散、无序的),而分类主要是建立连续值函数模型。

A. 对
B. 错

聚类的输入是一组未被标记 的样本,聚类根据数据自身的距离或相似度 将他们划分为若干组,划分的原则是组内样本最小化而组间(外部)距离最大化。

A. 对
B. 错

Apriori算法是最经典的挖掘频繁项集的算法,第一次实现了在大数据集上可行的关联规则提取,其核心思想是通过连接产生候选项与其支持度然后通过剪枝生成频繁项集。

A. 对
B. 错

答案查题题库