python实战:分析网站的m3u8文件下载ts文件并解密

简介: python实战:分析网站的m3u8文件下载ts文件并解密

前言

这个文章默认读者已了解m3u8的相关知识,包括如何在浏览器中查找m3u8文件的url和ts文件的下载地址;

代码实战

使用到的模块有:

os,requests, re,Crypto

主要模块Crypto在安装时执行命令如下:

pip install pycryptodome

实现逻辑:

  • 在浏览器里找到m3u8文件的额url
  • 解析m3u8文件,获取ts下载地址和解密所需的key

    在m3u8文件中,key所在的行一般以EXT-X-KEY标识,记录加密方法METHOD和key,iv等信息;IV值一般不需要;
  • 获取的ts是多个,需要单个下载,并解密

    根据获取的ts下载地址直接下载下来的文件,如果无法播放,那基本上就是加密了;需要通过获取的key来解密;
  • 下载的文件命名需要有规律,方便后续合成的需求;

实现代码如下:


'''
目标网站: 
根据m3u8文件下载ts并解密

'''

import os,requests,re
from Crypto.Cipher import AES
from Crypto.Util.Padding import pad

dest_folder = 'F:\kecom'

def d_ts_decrypt(key_url,ts_urls,folder='1'):
    '''
    下载ts并解密存储
    '''
    #先创建文件夹
    ts_dir = os.path.join(dest_folder,folder)
    if not os.path.exists(ts_dir):
        os.makedirs(ts_dir)

    key = requests.get(key_url).content   # 请求 key
    cryptor = AES.new(key, AES.MODE_CBC)    # 创建一个解密器
    start = 0
    for ts_url in ts_urls:
        start = start + 1
        print(ts_url)
        content = requests.get(ts_url).content #获取ts
        decrypt_content = cryptor.decrypt(content) #解密
        # 写入文件
        ts_file = os.path.join(ts_dir,str(start).zfill(4) + '.ts')
        with open(ts_file,'ab') as f:
            f.write(decrypt_content) 



#处理m3u8文件地址,解析出key和ts_url
def deal(m3u8_file_url,index='0'):
    
    mf_text = requests.get(m3u8_file_url).text
    #print(mf_text)
    ts = mf_text.split("\n")
    for l in ts:
        if 'URI' in l:
            keyUrl = re.findall(r'URI=".*?"',l)[0]
            break
    
    origin_url = m3u8_file_url[0:m3u8_file_url.index('voddrm')]
    #获取完整的url
    keyUrl = keyUrl.replace('URI=','').replace('"','')
    #print(keyUrl)
    ts_lines = [origin_url + line.replace('\n','')   for line in ts if 'start=' in line]
    #print(len(ts_lines),ts_lines[0])
    d_ts_decrypt(key_url=keyUrl,ts_urls=ts_lines,folder = index)
    #return keyUrl,ts_lines

m3u8_files = [
J2h0dHBzOi8vMTI1ODcxMjE2Ny52b2QyLm15cWNsb3VkLmNvbS8yNTEyMWE2YXZvZHRyYW5zYmoxMjU4NzEyMTY3L2U4ZWE1MDA5Mzg3NzAyMzA2NDkzMTIwMDY3L2RybS92b2Rkcm0udG9rZW4uZFdsdVBURTBOREV4TlRNM09UTXpNRFl4TlRjM09UdGxlSFE5TWpGaVpHRTRZamhsWlRSaU9EazNaalE0TnpOaU5XRmpZbVUwTldNd01qTXpaV1UyTlRJNVpqa3dObUl5T1dZelpUTTNaakUxTkRnMlltVTJNRFF6TVRKalptRTBOemxpT1RVM09UazBORFV4WldWaU0yUTJPV1UzTVRneVlqWXlOR0l3Wm1Sa05XWTVaR1k1WkdVeU0yWmpaVGhoTlRBeFpHVTJNbUZrTXpSalpqRTFNVEJrTWpFellqRTJNMlpoTzNWcFpGOTBlWEJsUFRJN2RXbGtYMjl5YVdkcGJsOTFhV1JmZEhsd1pUMHlPM1ZwWkY5dmNtbG5hVzVmWVhWMGFGOTBlWEJsUFRJN2RXbGtYMkZ3Y0dsa1BURTBNREF3TURBd01EZzdZMmxrUFRVNE9USTJPRGs3ZEdWeWJWOXBaRDB4TURZeE1EazVOekU3ZG05a1gzUjVjR1U5TUR0d2JHRjBabTl5YlQwei52LmYzMDc0Mi5tM3U4P2V4cGVyPTAmc2lnbj00MjA1NGZmMTk5MzliYzE1ZDEzNTY2NDYyZDg2MzNmMiZ0PTY0MkJDQjdEJnVzPTYxNTE3Mzg0OTMyNjIyNjI0MDEnLA
]

i = 0
for mf in m3u8_files:
    ''''''
    i = i + 1
    deal(mf,str(i))
    #break

上面代码下载的文件,应该可以播放了;但是文件很碎,如果需要合成,建议使用ffmpeg命令;

首先需要将所有文件索引放到一个文件中;
通过以下批处理命令实现:

(for %i in ( *.ts ) do @echo file '%i') > list.txt

通过FFMPEG的合并视频的命令生成一个完整的视频;

ffmpeg -f concat -safe 0 -i list.txt -c copy output.mp4
相关文章
|
3天前
|
数据采集 存储 JSON
Python网络爬虫:Scrapy框架的实战应用与技巧分享
【10月更文挑战第27天】本文介绍了Python网络爬虫Scrapy框架的实战应用与技巧。首先讲解了如何创建Scrapy项目、定义爬虫、处理JSON响应、设置User-Agent和代理,以及存储爬取的数据。通过具体示例,帮助读者掌握Scrapy的核心功能和使用方法,提升数据采集效率。
26 6
|
3天前
|
设计模式 前端开发 数据库
Python Web开发:Django框架下的全栈开发实战
【10月更文挑战第27天】本文介绍了Django框架在Python Web开发中的应用,涵盖了Django与Flask等框架的比较、项目结构、模型、视图、模板和URL配置等内容,并展示了实际代码示例,帮助读者快速掌握Django全栈开发的核心技术。
73 44
|
2天前
|
Linux 开发者 iOS开发
Python系统调用实战:如何在不同操作系统间游刃有余🐟
本文介绍了 Python 在跨平台开发中的强大能力,通过实际例子展示了如何使用 `os` 和 `pathlib` 模块处理文件系统操作,`subprocess` 模块执行外部命令,以及 `tkinter` 创建跨平台的图形用户界面。这些工具和模块帮助开发者轻松应对不同操作系统间的差异,专注于业务逻辑。
13 2
|
4天前
|
数据采集 前端开发 中间件
Python网络爬虫:Scrapy框架的实战应用与技巧分享
【10月更文挑战第26天】Python是一种强大的编程语言,在数据抓取和网络爬虫领域应用广泛。Scrapy作为高效灵活的爬虫框架,为开发者提供了强大的工具集。本文通过实战案例,详细解析Scrapy框架的应用与技巧,并附上示例代码。文章介绍了Scrapy的基本概念、创建项目、编写简单爬虫、高级特性和技巧等内容。
21 4
|
4天前
|
安全 数据库 开发者
Python Web开发:Django框架下的全栈开发实战
【10月更文挑战第26天】本文详细介绍了如何在Django框架下进行全栈开发,包括环境安装与配置、创建项目和应用、定义模型类、运行数据库迁移、创建视图和URL映射、编写模板以及启动开发服务器等步骤,并通过示例代码展示了具体实现过程。
21 2
|
22小时前
|
开发者 Python
探索Python中的装饰器:从入门到实战
【10月更文挑战第30天】本文将深入浅出地介绍Python中一个强大而有趣的特性——装饰器。我们将通过实际代码示例,一步步揭示装饰器如何简化代码、增强函数功能并保持代码的可读性。无论你是初学者还是有一定经验的开发者,这篇文章都将为你打开一扇通往更高效编程的大门。
|
3天前
|
网络协议 调度 开发者
Python网络编程:Twisted框架的异步IO处理与实战
【10月更文挑战第27天】本文介绍了Python网络编程中的Twisted框架,重点讲解了其异步IO处理机制。通过反应器模式,Twisted能够在单线程中高效处理多个网络连接。文章提供了两个实战示例:一个简单的Echo服务器和一个HTTP服务器,展示了Twisted的强大功能和灵活性。
13 0
|
3月前
|
SQL JSON 关系型数据库
n种方式教你用python读写excel等数据文件
n种方式教你用python读写excel等数据文件
|
5月前
|
存储 Python 内存技术
python WAV音频文件处理—— (1)读写WAV文件
python WAV音频文件处理—— (1)读写WAV文件
130 14
|
6月前
|
数据挖掘 索引 Python
Python 读写 Excel 文件
Python 读写 Excel 文件
161 0