python抓取网页,使用啥方法可以解析网页中的一部分,使打印出来的效果和在浏览器看到的是一样的
我们有类似的应用,我们使用的是 Screen Capture 也就是通过phantomjs 先截图再打印。
■网友
找出表格的xpath,直接把表格抓下来就可以了
■网友
用正则把内容抽出来,再格式化输出,不过直接输出是没法和原网页一样的,毕竟只是命令行。
■网友
直接把表格部分的html和相关的css也抓下来不就行了。要分析数据话就用抓到数据库里的数据,要看表格的的话就看保存的html。其实还可以把数据库里的特定数据读出来再生成html,放到浏览器或者webview这种组件里看。
推荐阅读
- 怎样成为一名合格的Python程序员?
- python 爬虫,咋获得输入验证码之后的搜索结果
- python的html5lib这个库咋使用啊我在网上也没有找到相关文档
- 零基础入门学习啥语言好
- PS网页版
- 网页设计和嵌入式哪个发展好一点?
- Python3.4和3.5区别大么
- Foxmail、Outlook等邮件客户端,哪个综合体验更好,与网页邮箱相比又怎样
- python 中 def_():...... return _有啥作用
- 新互联网网站用Java还靠谱么对比Php,Python,Ruby的话
