Python爬取下载m3u8加密视频，原来这么简单 _Python爬取

1.前言爬取视频的时候发现，现在的视频都是经过加密（m3u8），不再是mp4或者avi链接直接在网页显示，都是经过加密形成ts文件分段进行播放。
今天就教大家如果通过Python爬取下载m3u8加密视频。
2.分析网页1.电影视频来源http://www.caisetv.com/

文章插图

2.分析m3u8加密目录http://www.caisetv.com/dongzuopian/chaidanzhuanjia/0-1.html

文章插图

在视频播放的页面，通过F12可以查看网络数据包
https://xigua-cdn.haima-zuida.com/20210219/19948_fcbc225a/1000k/hls/index.m3u8

文章插图

这里的ts就电影的加密分段视频
https://xigua-cdn.haima-zuida.com/20210219/19948_fcbc225a/1000k/hls/上面的m3u8链接掉index.m3u8后，在拼上075a34cccdd000000.ts等ts名称就是分段视频的链接
如下所示：
https://xigua-cdn.haima-zuida.com/20210219/19948_fcbc225a/1000k/hls/075a34cccdd000000.ts通过浏览器把这个分段视频下载后打开：

文章插图

所以只要把所有的ts下载并合并就是完整的电影视频！！！
3.下载ts1.下载ts分段视频刚刚已经把ts的所有名称下载下来了

文章插图

接下来通过python代码去读取这个文件，提取出名称，拼接链接后下载保存到一个文件夹里！

headers = {'User-Agent': 'Mozilla/5.0 (windows NT 6.3; Win64; x64; rv:84.0) Gecko/20100101 Firefox/84.0',}###下载ts文件def download(url,name):r = requests.get(url, headers=headers)with open(name+"", "wb") as code:code.write(r.content)with open("index.m3u8","r") as f:ts_list = f.readlines()#去掉前面没用的信息ts_list = ts_list[5:]urlheader="https://xigua-cdn.haima-zuida.com/20210219/19948_fcbc225a/1000k/hls/"count = 0for i in ts_list:if "#" not in i:i = i.replace("n","")download(urlheader+""+i,"cdzj2/"+str(count)+".ts")count = count+1print(count)

文章插图

【Python爬取下载m3u8加密视频，原来这么简单】

这样就可以把ts文件全部下载下来，但是一个一个下载很慢，下面通过多线程下载，提升下载速度！！！
2.多线程下载ts视频

for i in ts_list:if "#" not in i:i = i.replace("n","")n = i[-7:]threading.Thread(target=download, args=(urlheader+""+i,"cdzj2/"+str(n),)).start()#download(urlheader+""+i,"cdzj2/"+str(count)+".ts")