文本数据处理的主要步骤包括:①数据分析 ②特征提取 ③分词 ④结果呈现 ⑤文本数据获取下列文本数据处理顺序正确的是( )
A. ①⑤②③④
B. ②⑤③①④
C. ⑤①③②④
D. ⑤③②①④
查看答案
下列关于中文分词方法的描述中,属于基于词典的分词方法的是( )
A. 在分析句子时与词典中的词语进行对比,词典中出现的就划分为词
B. 依据上下文中相邻字出现的频率统计,同时出现的次数越高就越可能组成一个词
C. 让计算机模拟人的理解方式,根据大量的现有资料和规则进行学习,然后分词
D. 依据词语与词语之间的空格进行分词
在中文文本分析中,一般不用做文本的特征项的是( )
A. 字
B. 词
C. 短语
D. 段落
以下代码中用来设置“允许词云最大词汇” 的语句是( )wc=WordCloud(font_path='msyhbd.ttf',①background_color='white',②max_words=200,③mask=bg_pic,max_font_size=100④)
A. ①
B. ②
C. ③
D. ④
以下函数中,用来设置词云制作时坐标轴的是( )
A. pyplot.figure
B. pyplot.imshow
C. pyplot.xlabel
D. pyplot.axis