为啥Python2.7爬虫无法获取全部Cookie 用requests的

用requests的session()方法就是了,s = requests.session()r = s.post(url, data) # 登录s.get(url1) 这是保持登录状态的访问
■网友
这个问题没有仔细去研究，只是根据我写浏览器程序所做的推断。Cookie是一种特定的数据结构，里面存的数据不一定都通过http来自网站，编写浏览器相关的程序的时候，知道cookie这个数据结构有个字段：isHttpOnly，如果设置为true表示只能由http修改cookie值。那如果是false会发生什么呢？cookieManager开放了一个方法add（），可以添加cookie所以我猜测是不是在浏览器侧添加了其他cookie，从而造成你观察到的现象？不过我没有去实际检验过
■网友
一般有反爬的网站，cookie值你直接抓肯定抓不全，因为有一部分是他自定义函数生成的，一般都是跟时间戳有关，你需要找到它的生成方式，然后破解模拟生成，组成一个完成的cookie

■网友
如果禁掉了js，只可能是 @宫伟峰提到的重定向问题，你拿到的是重定向之前的cookie，重定向之后的页面里的cookie你没有拿到，但是那个重定向之前的cookie至少包含了你的sessionid
■网友
Python的我不懂，以前也写过也是跟洛克的方法一样。不过我用Java写的时候也遇到了这样的问题，用HttpURLConnection 获取的cookies是不完整的，但是用JSoup就能获取完整的cookies，后来我禁止了 HttpURLconnection 自动访问重定向的页面，就拿到了完整的cookies。不知道你的是不是这个问题，权当提个思路。
■网友
使用瑞雪采集云, 可以轻松的处理cookie的问题:
企业爬虫专家：适合企业使用的数据采集平台-瑞雪采集云
■网友
【为啥Python2.7爬虫无法获取全部Cookie】 我也是遇到这个问题了，要爬去的网站是java写的，模拟登录后提示登录成功，获取到的jsessionid再次请求就无法获取登录后的页面，经我测试这个jsessionid确实没有登录。我浏览器查看的时候，请求login方法的时候，request包含已经登录后的jsessionid，response 的setcookie 的jseessionid根本无法请求登录后的页面。困扰我好多天了，没想到解决办法，本来想抓包看看具体请求过程，可是我们的计算机不允许使用代理。

为啥Python2.7爬虫无法获取全部Cookie

推荐阅读

鞠婧祎|《花戎》首播差评如潮，网友差评的理由出奇的一致！

鞠婧祎 |《漂亮书生》鞠婧祎演技精湛，凤凰涅槃

高通三大运营商纷纷力挺，高通受损紧急转变态度，华为5G最后底牌亮出

为啥单身久的人讨厌喜欢她的异性

极致|中国水彩：大笔触画出霸屏水彩，光感够绝，极致东方的美！

乐园园讲八卦|蔡少芬：这是我18，王祖贤：对不起请让让，朱茵：这是我18岁

「二叠纪」南京专家最新研究发现：大灭绝后湖泊生态系统复苏需要一千万年

淘宝超级推荐营销场景计划

新片区成立一周年，上海移动“新基建”“双千兆”成绩亮眼

中国好声音|中国好声音：傅欣瑶不堪舆论压力，坦言只是一场戏，你们太认真了

中国IDC圈：加速多元AI算力落地，浪潮与寒武纪签约

数字|交行行长：人民币国际化2.0版必是注入数字元素的体系竞争

营业顺丰：8月速运物流业务营收111.57亿元同比增长28.3%

converse 官网的鞋是真的么匡威官网定制网址

IT爱好者的圈子智能”照明设备ABB”系统给人类催起了极大的节能控制

荷叶泡茶能减肥,普洱荷叶茶能不能减肥

『做饭小七七』南瓜此种做法，营养又美味，学会此做法，一顿2斤南瓜不够吃

男生考北大骑马戴红花返乡|男生考北大骑马戴红花返乡读书改变命运！

总是担心自己工作出错，害怕因为自己的原因造成损失，单位要我赔偿，很痛苦，咋办

【科技日报】2020年成都新生大熊猫幼仔国庆前亮相