题目内容

在大规模的语料中,挖掘词的相关性是一个重要的问题。以下哪一个信息不能用于确定两个词的相关性()。

A. 互信息
B. 最大熵
C. 卡方检验
D. 最大似然比

查看答案
更多问题

(假设precision=TP/(TP+FP),recall=TP/(TP+FN)。)在二分类问题中,当测试集的正例和负例数量不均衡时,以下评价方案哪个是相对不合理的()

Accuracy:(TP+TN)/all
B. F-value:2*recall*precision/(recall+precision)
C. G-mean:sqrt(precision*recall)
D. AUC:曲线下面积

在以下不同的场景中,使用的分析方法不正确的有()

A. 根据商家最近一年的经营及服务数据,用聚类算法判断出天猫商家在各自主营类目下所属的商家层级
B. 根据商家近几年的成交数据,用聚类算法拟合出用户未来一个月可能的消费金额公式
C. 用关联规则算法分析出购买了汽车坐垫的买家,是否适合推荐汽车脚垫
D. 根据用户最近购买的商品信息,用决策树算法识别出淘宝买家可能是男还是女

假设我们有一个数据集,在一个深度为6的决策树的帮助下,它可以使用100%的精确度被训练。现在考虑一下两点,并基于这两点选择正确的选项。注意:所有其他超参数是相同的,所有其他因子不受影响。
1.深度为4时将有高偏差和低方差
2.深度为4时将有低偏差和低方差

A. 只有 1
B. 只有 2
C. 1 和 2
D. 没有一个

通过电磁波传递热量的过程叫()

A. 导热
B. 对流
C. 折射
D. 辐射

答案查题题库