前言国内大学最新排名,北大反超,浙大仅第四,中科大跌至第八
时隔五年,“双一流”大学即将迎来首次大考,这也是继改变高校评断标准之后,第一次即将以官方对外发布,自然是引来了许多人的关注 。最近,有许多不同机构发布的国内高校排名,但彼此之间的差异很大,网友之间的争议也很大 。
私信小编01即可获取大量Python学习资料项目目标爬取高三网大学排名,并保存
目标网址
http://m.gaosan.com/gaokao/265440.html
文章插图
基本环境配置
- python 3.6 pycharm
【Python爬虫练习:爬取800多所大学学校排名、星级等】
import requestsimport parselimport csv
请求网页数据文章插图
文章插图
?
url = 'http://m.gaosan.com/gaokao/265440.html'headers = {'User-Agent': 'Mozilla/5.0 (windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'}response = requests.get(url=url, headers=headers)response.encoding = response.apparent_encoding
爬取数据selector = parsel.Selector(response.text)trs = selector.css('#page tr')for tr in trs:dit = {}ranking = tr.css('td:nth-child(1)::text').get()dit['名次'] = rankingschool = tr.css('td:nth-child(2)::text').get()dit['学校名称'] = schoolscore = tr.css('td:nth-child(3)::text').get()dit['综合得分'] = scorestar = tr.css('td:nth-child(4)::text').get()dit['星级排名'] = starlevel = tr.css('td:nth-child(5)::text').get()dit['办学层次'] = levelcsv_writer.writerow(dit)
文章插图
?
保存数据
f = open('排名.csv', mode='a', encoding='utf-8', newline='')csv_writer = csv.DictWriter(f, fieldnames=['名次', '学校名称', '综合得分', '星级排名', '办学层次'])f.close()
运行代码,效果如下图文章插图
?
文章插图
?
文章插图
?
推荐阅读
- 60行Python代码轻松搞定数据库查询 1秒找到需要的数据
- C++调用python解释器
- 软件测试工具monkeyrunner基于python脚本开发
- python基础——数据结构栈的详解
- Python高能小技巧:用海象操作符减少重复代码
- python打包exe 小工具
- 老年人练习太极拳有什么注意事项
- 练习太极拳对身体有何好处
- 初学者练习太极拳需注意的五个要点
- 练习太极好处多 强心养肝健脾补肺