文章插图
作者:kingname
我做了一个垃圾信息过滤的 HTTP 接口 。现在有一千万条消息需要经过这个接口进行垃圾检测 。
一开始我的代码是这样的:
import requestsmessages = ['第一条', '第二条', '第三条']for message in messages:resp = requests.post(url, json={'msg': message}).json()if resp['trash']:print('是垃圾消息')
【一招大幅提升 requests 访问速度】我们写一段代码来看看运行速度:文章插图
访问一百次百度,竟然需要 20 秒 。那我有一千万条信息,这个时间太长了 。有没有什么加速的办法呢?除了我们之前文章讲到的 多线程、aiohttp 或者干脆用 Scrapy 外,还可以让 requests 保持连接从而减少频繁进行 TCP 三次握手的时间消耗 。那么要如何让 requests 保持连接呢?实际上非常简单,使用Session对象即可 。修改后的代码:
import requestsimport timestart = time.time()session = requests.Session()for _ in range(100):resp = session.get('https://baidu.com').content.decode()end = time.time()print(f'访问一百次网页,耗时:{end - start}')
运行效果如下图所示:文章插图
性能得到了显著提升 。访问 100 页只需要 5 秒钟 。在官方文档[1]中,requests 也说到了 Session对象能够保持连接:
?The Session object allows you to persist certain parameters across requests. It also persists cookies across all requests made from the Session instance, and will use urllib3’s connection pooling. So if you’re making several requests to the same host, the underlying TCP connection will be reused, which can result in a significant performance increase (see HTTP persistent connection).”
?Excellent news — thanks to urllib3, keep-alive is 100% automatic within a session! Any requests that you make within a session will automatically reuse the Appropriate connection!”
推荐阅读
- 信用卡提升额度原因怎么填写
- 靠边停车后,在车内如何判断与路肩的距离?一招学会不用下车看
- 眼霜|升级了个寂寞,还是真有提升?深度解析欧莱雅第二代紫熨斗眼霜
- 一招解决80%系统问题,win10“隐藏”高级选项,新手也能修电脑!
- 网站推广之如何让网站排名稳步提升
- 万能白T穿搭技巧,快速提升衣品
- 利用seo提升网站排名
- 淘宝直播人气怎么刷 淘宝直播如何提升流量
- 苹果|iOS 16升级细节曝光:苹果提升速度iPhone 6S等欲被抛弃
- 电动车太久不用,电池被“饿死”充不进电咋办?这一招免费又有效