A. 不可达网页 B. 可达网页 C. 多链接网页 D. 自有网页
A. 每个支持网页的PageRank为β/M+(1-β)/N B. 目标网页的PageRank值为Y=X+β2+(1-β)/N C. 因为N非常大,1-β很小,所以(1-β)/N很小,可以忽略 D. t某些时候可以忽略不计
A. 待采集URL池 B. DNS解析模块 C. 复制模块 D. URL去重模块
A. 信息是用来消除随机不定性的东西 B. 信息论中,信息的信息量为熵 C. 信息和数据是相互独立、相互区别的 D. 信息是客观存在的事物,是客观事物运动和变化的一种反映。
A. 所有的支持网页只指向目标页 B. 目标网页指向一些或所有的支持页 C. 支持页之间有链接 D. 所有的劫持链接指向目标网页
A. 索引词典和倒排表 B. 索引词典和词项排序序列 C. 倒排表和词项序列 D. 词项序列和索引字符
A. 格式信息 B. 标签信息 C. 网页体信息 D. 头部信息
A. file://C:/离退休信息系统/html例子.html B. http://news.sina.com.cn/s/2013-03-24/071926623511.shtml C. ftp://ftp.acc.umu.se/ D. http://www.rpc.edu.cn:80/www/index.htm
A. 社会舆情是网络舆情的子集 B. 社会舆情是网络舆情的投影 C. 网络舆情是社会舆情的映射 D. 两者没有关系
A. I(X,Y)=H(X)+H(X/Y) B. I(X,Y)=H(X)-H(X/Y) C. I(X,Y)=H(X)+H(Y/X) D. I(X,Y)=H(X)-H(Y/X)