python知识点100篇系列(18)-解析m3u8文件的下载视频

本文涉及的产品
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
云解析 DNS,旗舰版 1个月
全局流量管理 GTM,标准版 1个月
简介: 【10月更文挑战第6天】m3u8是苹果公司推出的一种视频播放标准,采用UTF-8编码,主要用于记录视频的网络地址。HLS(Http Live Streaming)是苹果公司提出的一种基于HTTP的流媒体传输协议,通过m3u8索引文件按序访问ts文件,实现音视频播放。本文介绍了如何通过浏览器找到m3u8文件,解析m3u8文件获取ts文件地址,下载ts文件并解密(如有必要),最后使用ffmpeg合并ts文件为mp4文件。
  • 什么是m3u8:

    m3u8是苹果公司推出的视频播放标准,是m3u8的一种,只是编码格式采用的是UTF-8。

其实m3u8是一种索引文件,m3u8文件中记录了视频的网络地址;

  • 和m3u8配套的一个概念是HLS:

HLS(Http Live Streaming) 是一个由苹果公司提出的基于HTTP的流媒体网络传输协议,直接把流媒体切片成一段段ts文件,通过m3u8索引文件按序访问ts文件,客户端不停的从服务器获取文件,实现播放音视频的功能

HLS 的工作原理是把整个流分成一个个小的基于 HTTP 的文件来下载,每次只下载一些。在开始一个流媒体会话时,客户端会下载一个包含元数据的 (m3u8) playlist文件,用于寻找可用的媒体流。

基于以上的概念,如果要下载相关的ts文件,首先是需要找到m3u8文件;

  • 下载m3u8文件:

m3u8文件一般可以直接在浏览器里找到,打开目标视频播放页面,按F12打开开发者模式

在这里插入图片描述
选择NetWork,在过滤框中输入m3u8过滤,皆可以找到m3u8文件;
点击链接,就能看到m3u8文件的内容;
在这里插入图片描述

可以看到有多个ts文件相关记录,这个ts是最终要下载的文件信息;

网络上部分m3u8文件中会记录ts文件的全路径地址,直接使用,下载即可;
如果是ts文件的相对路径,需求去浏览器中找到一个请求ts文件的链接,按照模块拼接成全路径即可;

  • 有了m3u8文件,下一步是解析,获取下载地址

使用Python解析m3u8文件伪代码如下:

def parseM3u8(m3u8_file):
    '''解析m3u8'''
    ts_lines = []
    with open(m3u8_file,'r') as f:
        lines = f.readlines()
        ts_lines = [line.replace('\n','') for line in lines if 'start=' in line]
    return ts_lines;

传入m3u8文件地址,只获取到ts相关的记录信息,存入列表中;

  • 获取到ts文件地址,开始下载文件

def downloadTs(lines):
    key = getKey()
    n = 0
    for args in lines:
        n = n + 1
        download_url = f'https://***4cb1544e5285890819192252940/drm/{args}&st=63811ac1&us=neOGEIULKi'

        ts_c = requests.get(url=download_url).content
        filename = f'H:/ts/{str(n).zfill(4)}.ts'
        with open(filename,'wb') as f:
            f.write(ts_c)

循环ts文件下载地址列表,下载单个文件,并有规律的命名;以便于后续合并;

  • 如果ts下载的文件无法播放,那可能是需要解密:

首先查看一下m3u8文件中是否有类似下图的文字;其中URI指向的就是加密的key;
在这里插入图片描述
如图所示,METHOD=AES-128,代码加密的方式是AES,所以解密也需要使用ASE;

  • 解密需要使用Crypto

安装Crypto:

直接安装Crypto,可能会导致找不到模块,尤其是在python3.8版本上;
所以推荐使用以下命令直接安装:

pip install pycryptodome

安装完成后,编写解密代码:


def aes_decrypt(data, key, iv):    
    from Crypto.Cipher import AES
    from Crypto.Util.Padding import pad
    new_data = pad(data_to_pad=data, block_size=AES.block_size)    
    aes_d = AES.new(key, AES.MODE_CBC, iv)    
    return aes_d.decrypt(new_data)

如果运行以上代码,提示找不到模块,那需要改个文件夹名称;

**\Lib\site-packages 中找到一个文件夹叫做crypto,将c改成C,即可

  • 解密ts文件;
    在上面下载ts文件代码的最后一句后,修改如下:

    with open(filename,'wb') as f:

    f.write(aes_decrypt(ts_c,key,key))

  • 合并ts文件;
    由于文件数量多,所以首先需要将ts文件写入到txt文件中;
    然后使用ffmpeg命令合并ts文件为mp4文件;

实现的伪代码如下:

def ts2mp4():
    '''合并ts文件到mp4'''
    import os
    file_list = os.listdir('H:/ts')
    #file_list.sort(key=lambda x: int(x[0:-12])) # 文件名 按数字排序
    with open('ts1.txt','w') as f:
        f.writelines([f'file /ts/{filepath}\n' for filepath in file_list])
        f.close()
    os.system('ffmpeg -f concat -safe 0  -i ts1.txt -c copy ts1.mp4')

总结

以上代码实现了从m3u8文件中获取ts文件,下载并合并为mp4文件的功能

相关文章
|
2天前
|
安全 Linux 数据安全/隐私保护
python知识点100篇系列(15)-加密python源代码为pyd文件
【10月更文挑战第5天】为了保护Python源码不被查看,可将其编译成二进制文件(Windows下为.pyd,Linux下为.so)。以Python3.8为例,通过Cython工具,先写好Python代码并加入`# cython: language_level=3`指令,安装easycython库后,使用`easycython *.py`命令编译源文件,最终生成.pyd文件供直接导入使用。
python知识点100篇系列(15)-加密python源代码为pyd文件
|
1天前
|
XML 前端开发 数据格式
Beautiful Soup 解析html | python小知识
在数据驱动的时代,网页数据是非常宝贵的资源。很多时候我们需要从网页上提取数据,进行分析和处理。Beautiful Soup 是一个非常流行的 Python 库,可以帮助我们轻松地解析和提取网页中的数据。本文将详细介绍 Beautiful Soup 的基础知识和常用操作,帮助初学者快速入门和精通这一强大的工具。【10月更文挑战第11天】
12 2
|
4天前
|
Web App开发 SQL 数据库
使用 Python 解析火狐浏览器的 SQLite3 数据库
本文介绍如何使用 Python 解析火狐浏览器的 SQLite3 数据库,包括书签、历史记录和下载记录等。通过安装 Python 和 SQLite3,定位火狐数据库文件路径,编写 Python 脚本连接数据库并执行 SQL 查询,最终输出最近访问的网站历史记录。
17 4
|
3天前
|
机器学习/深度学习 编解码 算法
深入解析MaxFrame:关键技术组件及其对视频体验的影响
【10月更文挑战第12天】随着流媒体服务和高清视频内容的普及,用户对于视频质量的要求越来越高。为了满足这些需求,许多技术被开发出来以提升视频播放的质量。其中,MaxFrame是一种旨在通过一系列先进的图像处理算法来优化视频帧的技术。本文将深入探讨构成MaxFrame的核心组件,包括运动估计、超分辨率重建以及时间插值算法,并讨论这些技术如何协同工作以改善视频播放效果。
9 1
|
4天前
|
Python
Python 三方库下载安装
Python 三方库下载安装
10 1
|
8天前
|
缓存 Java 程序员
Map - LinkedHashSet&Map源码解析
Map - LinkedHashSet&Map源码解析
25 0
|
8天前
|
算法 Java 容器
Map - HashSet & HashMap 源码解析
Map - HashSet & HashMap 源码解析
22 0
|
8天前
|
存储 Java C++
Collection-PriorityQueue源码解析
Collection-PriorityQueue源码解析
19 0
|
8天前
|
安全 Java 程序员
Collection-Stack&Queue源码解析
Collection-Stack&Queue源码解析
19 0
|
6天前
|
存储
让星星⭐月亮告诉你,HashMap的put方法源码解析及其中两种会触发扩容的场景(足够详尽,有问题欢迎指正~)
`HashMap`的`put`方法通过调用`putVal`实现,主要涉及两个场景下的扩容操作:1. 初始化时,链表数组的初始容量设为16,阈值设为12;2. 当存储的元素个数超过阈值时,链表数组的容量和阈值均翻倍。`putVal`方法处理键值对的插入,包括链表和红黑树的转换,确保高效的数据存取。
27 5