python爬取搜索网址的a标签内容 _python

代码如下：
#注意：本电脑环境是Python 3.7#下面是导入相应模块import requests #导入requests库from bs4 import BeautifulSoup #导入解析库import pandas as pd#下面是网页请求url="http://q.stock.sohu.com/" #设置请求网址为搜索网址response=requests.get(url) #对搜狐网站就行get请求并将请求结果赋值给responseresponse.encoding='utf-8' #设置编码为utf-8格式的html=response.text #获取网页的html源代码并赋值给html#下面是网页解析soup=BeautifulSoup(html,'lxml') #将lxml解析为htmlcontent=soup.findAll('a') #查找所有的a标签内容并赋值给contentfor aa in content: #遍历查到的的a标签内容 print(aa.get('href')) #获取a href后面的网址，并打印出来#下面是保存数据df=pd.DataFrame(content,columns=["网址"]) #设置列标为网址，单元格数据为content内容df.to_Excel("搜索a标签内容.xlsx") #将df数据存入搜索a标签内容.xlsx中运行结果如下：
/
//s.m.sohu.com/t/index.html
//q.stock.sohu.com/feedback.html
//q.stock.sohu.com/cn/mystock.shtml
//q.stock.sohu.com/cn/bk.shtml
//q.stock.sohu.com/cn/ph.shtml
//q.stock.sohu.com/cn/zs.shtml
//q.stock.sohu.com/fundflow/
/sdk/rank
//stock.sohu.com/ipo/
//q.stock.sohu.com/App2/bigdeal2.jsp
//q.stock.sohu.com/app2/rpsholder.up
//q.stock.sohu.com/app2/mpssTrade.up
//stock.sohu.com/s2011/jlp/
//q.fund.sohu.com/jzph/zxjz_date_up.shtml
【python爬取搜索网址的a标签内容】//q.stock.sohu.com/us/zgg.html
JAVAscript:void(0);
/sdk/transfer?page=callin
/sdk/transfer?page=callin
/sdk/transfer?page=callout
/sdk/transfer?page=cancel
/sdk/transfer?page=record
//mp.sohu.com
JavaScript:void(0);
javascript:void(0);
javascript:void(0);
//q.stock.sohu.com/cn/ph_m.shtml?type=sh_as&field=changerate&sort=up
//q.stock.sohu.com/cn/ph_m.shtml?type=sz_as&field=changerate&sort=up
//q.stock.sohu.com/cn/bk.shtml
//q.stock.sohu.com/cn/bk.shtml
//q.stock.sohu.com/cn/bk.shtml
//q.stock.sohu.com/cn/bk.shtml
javascript:void(0);
javascript:void(0);
/sdk/rank
//q.stock.sohu.com/cn/mystock.shtml
javascript:void(0);
//q.stock.sohu.com/fundflow/stock_inflow.html?name=NetVal&io=In
//q.stock.sohu.com/fundflow/stock_inflow.html?name=NetVal&io=Out
//q.stock.sohu.com/app2/mpssTrade.up
//q.stock.sohu.com/app2/mpssTrade.up
//q.stock.sohu.com/app2/bigdeal2.jsp
图片示例如下：

文章插图

python爬取搜索网址的a标签内容

推荐阅读

斩获118个5G合同，欧洲巨头趁虚而入，追上华为仅差一步之遥

国家农机购机补贴政策促采茶机的更新换代

节约的生活▲不屑的眼神被放大，姑娘要凉凉，《青春有你2》：女学员暗示蔡徐坤管的宽

A股周一大涨沪指涨逾5%突破3300点

「吃购爱食兄」也绝不闲在家里！励志好文，宁可累趴在路上

『扬眼』天海官宣自救基本成功？，「天海准入闹剧」股权转让无效咋办？万通改成“赞助”

砍大话解决了很多人的困扰，你家有废旧不用的磁卡吗？这个用途太聪明了

|180㎡高级灰住宅，现代人追求的宁静、高端，这里都有！

这世道究竟是玻璃心太多，还是缺少关爱

白鲸瞭望台|延长禁运失败，引来伊朗无情嘲讽，美国遭同盟国“集体背叛”

如何制作留娘糕？留娘糕怎么做

《西游记》中的唐僧为何总被提议蒸着吃？知道原因后，哭笑不得

CDN与缓存全面详聊，看完之后，大部分程序员收藏了

牙膏是酸性还是碱性

9种丰胸食品哪种丰胸产品好？12种有效的丰胸食物

股市|A股市场：如果手中10万资金想快速赚到460万，建议牢记双线之上

火锅冻丸香弹美味竟含十多种添加剂

马栏山新闻央视特别节目《坐着高铁看中国》：5G智慧电台“飘”上高铁

假饵钓鱼技巧和方法假饵钓鱼技巧

这些 CSS 伪类，你可能还不知道，可以用起来了