一、实验目的1.掌握Python标准库urllib的用法;2.掌握Python扩展库scrapy的用法;3.掌握Python扩展库BeautifulSoup4的用法;4.掌握Python扩展库reuqests的用法;5.运用爬虫爬取指定网页的内容。二、实验内容1.使用标准库urllib爬取“http://news.pdsu.edu.cn/info/1005/31269.htm”平顶山学院新闻网上的图片,要求:保存到F盘pic目录中,文件名称命名规则为“本人姓名”+ “_图片编号”,如姓名为张三的第一张图片命名为“张三_1.jpg”。
采用scrapy爬虫框架,抓取平顶山学院新闻网(http://news.pdsu.edu.cn/)站上的内容,具体要求:抓取新闻栏目,将结果写入lm.txt。
采用request爬虫模块,抓取平顶山学院网络教学平台上的Python语言及应用课程上的每一章标题(http://mooc1.chaoxing.com/course/206046270.html)。
如果要筛选计算机成绩>=90的同学,将筛选出的成绩设置为红色,进行的步骤如下:步骤1:选择“数据”选项卡,单击“筛选”步骤2:单击“数字筛选”→选择“大于”,输入90步骤3:选择筛选出的成绩步骤4:在字体面板设置颜色为红色操作完成后发现成绩与实际不符,你认为错误在于( )。(2分)
A. 步骤1
B. 步骤2
C. 步骤3
D. 步骤4