python爬虫爬取页面,爬到空白的一段,但是网页上源代码不是空白
class不算内容吧。。另外从这个class的字面意思看,就表示"这个地方是空的"
■网友
是不是没有编码没有转换 当初用sublime text时,没转码就会在终端显示空白。
■网友
应该是JS加载的吧,用selenium或者PhantomJS解决.
■网友
这说明空白部分的html是js加载的,利用python的selenium完成整个页面的加载就可以了。selenium参考:selenium + python自动化测试环境搭建
■网友
把网页链接发出来看看啊
■网友
有两种可能:1、源代码里面有js代码,那块空白代码是浏览器执行js添加进去的。2、你抓的网站很老(比如某些老的asp网站),支持的标签有限,浏览器自动解释为其它的标签了。
推荐阅读
- 怎样成为一名合格的Python程序员?
- python 爬虫,咋获得输入验证码之后的搜索结果
- python的html5lib这个库咋使用啊我在网上也没有找到相关文档
- 零基础入门学习啥语言好
- Python3.4和3.5区别大么
- python 中 def_():...... return _有啥作用
- 新互联网网站用Java还靠谱么对比Php,Python,Ruby的话
- 30岁男,创业失败转行学python,是否很晚?也不好找工作?
- Python 的开发速度比 C#.net 或 Vb.net 更快吗?
- 1、相同的网址,为啥浏览器http和https都能登录,而爬虫不行\n2、网页下载内容不全
