文本信息量可以用熵来度量,一段文本中共出现32个符号,这段文本的最大信息熵是
查看答案
下列对文本聚类描述正确的是
A. 动态聚类法的聚类结果具有稳定性
B. 等级聚类法的聚类结果与文档的初始排列次序有关
C. 文本聚类是一种重要的文本挖掘技术
D. 基于密度的聚类方法善于处理高维度的数据
下列不属于主题字段的是
A. title
B. abstract
C. language
D. descriptor
将文本内容信息和文档结构信息相结合的检索模型称为。
顺排文档与倒排文档的区别在于前者以作为处理和检索的单元,后者以作为处理和检索的单元。