下面哪一类网页不是链接作弊者眼中的网页。()
A. 不可达网页
B. 可达网页
C. 多链接网页
D. 自有网页
在单一目标垃圾农场模型中,令X为所有可达网页为垃圾农场贡献的PageRank总量(每个指向t的可达网页p的PageRank乘以β除以p的出度数之后进行累加求和),令Y为t的未知的PageRank值。那么下列选项中正确的是()
A. 每个支持网页的PageRank为β/M+(1-β)/N
B. 目标网页的PageRank值为Y=X+β2+(1-β)/N
C. 因为N非常大,1-β很小,所以(1-β)/N很小,可以忽略
D. t某些时候可以忽略不计
下面不属于网页采集器架构的模块是()
A. 待采集URL池
B. DNS解析模块
C. 复制模块
D. URL去重模块
下列关于信息的描述,错误的是( )
A. 信息是用来消除随机不定性的东西
B. 信息论中,信息的信息量为熵
C. 信息和数据是相互独立、相互区别的
D. 信息是客观存在的事物,是客观事物运动和变化的一种反映。