知乎需要加载的网页怎样用爬虫爬取额

额，谢邀。今天好像挺晚了我简单说下…一般这种动态往下滚自己刷新的都是有js脚本来获取并且加载的…你开个firebug，观察下在加载新的信息的时候浏览器发送了什么得到了什么…一般都是json数据。其实在一个问题下回答数超过50的情况下好像也会只加载前面一部分~剩下的等你滚到底部之后才会动态加载…这一部分的处理应该在zhihu.py的Question类的answers属性方法里有体现~可以参考一下…现在是手机没法贴链接明天补…但是题主应该知道链接啦就这样…明天再详细写…睡了。
■网友
没有人邀请，
不过这个问题应该不是什么问题，
可以给出源码，
bufubaoni/SimpleSpider
给出了为数不多的借口文件
其中有一个为 question.py 的类
里边有一点测试的代码

这样你就可以得到整个问题的答案了，其中内容包括
这样你就可以得到整个问题的答案了，其中内容包括
答案的id点赞数答案的内容用户信息
答案的id 又可以传给

VotersProfile 这个类
VotersProfile 这个类
你同时又可以获得这个答案的点赞名单，点赞人的url_token
将这个url_token 传入另外的
answer.py followers.py following.py 几个类中，有能得到这个人回答的问题，关注者，和关注的人。
同样方法如下

用法是一样的，
用法是一样的，
当然你不用担心翻页的问题，因为已经做好了，只要调用就可以了。
当然我没有使用模拟登录的方法，
主逻辑很简单。
=====================================================
现在稍微复杂一点，不过调用了questions的api变得抓取问题更简单了。
现在使用gevent来发送余下部分的请求，效率会更高了。
剩下的都写到github里边了。

■网友
【需要加载的网页怎样用爬虫爬取】 github

知乎需要加载的网页怎样用爬虫爬取

推荐阅读

大叔下厨房|广东人爱吃鱼，这道双酥带鱼煲仔，酥脆味美，香气扑鼻，超级好吃，原创

新车 | 颜值进化配置升级，新款三菱奕歌日本上市，国内还远吗

委员会|中金公司将于9月17日首发上会

罗天宇|TVB“女神收割机”新剧挑战流氓律师，专为弱势发声，与同性共浴

幽默搞笑段子集锦|单身，长得非常漂亮，就是没有男朋友，幽默笑话：堂妹已经28了

[美国]中国赢了，暴乱下，美国终于松口“放人”！

返流食管炎中药怎么治疗？

凇清幕雨@踩20cm“细针”腿功了的, 看到生图, 我信你40了，陈乔恩走红毯,

新华网|何文花：轮椅上编织幸福人生

美国大选|美国大选最后关头，结果还没出来，输家却已经一目了然

私生饭|哈哈哈有些东西还真TM全国统一，男女事罢后第一句话会说什么?

「水果」当年为了变瘦不吃饭，3年只吃水果充饥的200斤女孩，如今变得怎样了？

互联网微信公众号“问答”具体怎么玩？支持随图文消息一并转发

百度|百度的概念车可太好笑了

3C毒物 14部手机电池续航测试：华为P40Pro排名第十小米倒数第三

图赏|新一代锐龙7 5700U加持！荣耀MagicBook 14锐龙版图赏

蚕丝床单被罩能机洗吗蚕丝床单被罩可不可以放洗衣机洗

cdr应该如何才能画表格

这些果皮能变白吗？是你做的吗？

[长安汽车]这款国六suv，比星越霸气，2.0t配8at，油耗8.2l