python抓取网页,使用啥方法可以解析网页中的一部分,使打印出来的效果和在浏览器看到的是一样的

我们有类似的应用,我们使用的是 Screen Capture 也就是通过phantomjs 先截图再打印。
■网友
找出表格的xpath,直接把表格抓下来就可以了
■网友
用正则把内容抽出来,再格式化输出,不过直接输出是没法和原网页一样的,毕竟只是命令行。
■网友
直接把表格部分的html和相关的css也抓下来不就行了。要分析数据话就用抓到数据库里的数据,要看表格的的话就看保存的html。其实还可以把数据库里的特定数据读出来再生成html,放到浏览器或者webview这种组件里看。


    推荐阅读