python实战:分析网站的m3u8文件下载ts文件并解密

简介: python实战:分析网站的m3u8文件下载ts文件并解密

前言

这个文章默认读者已了解m3u8的相关知识,包括如何在浏览器中查找m3u8文件的url和ts文件的下载地址;

代码实战

使用到的模块有:

os,requests, re,Crypto

主要模块Crypto在安装时执行命令如下:

pip install pycryptodome

实现逻辑:

  • 在浏览器里找到m3u8文件的额url
  • 解析m3u8文件,获取ts下载地址和解密所需的key

    在m3u8文件中,key所在的行一般以EXT-X-KEY标识,记录加密方法METHOD和key,iv等信息;IV值一般不需要;
  • 获取的ts是多个,需要单个下载,并解密

    根据获取的ts下载地址直接下载下来的文件,如果无法播放,那基本上就是加密了;需要通过获取的key来解密;
  • 下载的文件命名需要有规律,方便后续合成的需求;

实现代码如下:


'''
目标网站: 
根据m3u8文件下载ts并解密

'''

import os,requests,re
from Crypto.Cipher import AES
from Crypto.Util.Padding import pad

dest_folder = 'F:\kecom'

def d_ts_decrypt(key_url,ts_urls,folder='1'):
    '''
    下载ts并解密存储
    '''
    #先创建文件夹
    ts_dir = os.path.join(dest_folder,folder)
    if not os.path.exists(ts_dir):
        os.makedirs(ts_dir)

    key = requests.get(key_url).content   # 请求 key
    cryptor = AES.new(key, AES.MODE_CBC)    # 创建一个解密器
    start = 0
    for ts_url in ts_urls:
        start = start + 1
        print(ts_url)
        content = requests.get(ts_url).content #获取ts
        decrypt_content = cryptor.decrypt(content) #解密
        # 写入文件
        ts_file = os.path.join(ts_dir,str(start).zfill(4) + '.ts')
        with open(ts_file,'ab') as f:
            f.write(decrypt_content) 



#处理m3u8文件地址,解析出key和ts_url
def deal(m3u8_file_url,index='0'):
    
    mf_text = requests.get(m3u8_file_url).text
    #print(mf_text)
    ts = mf_text.split("\n")
    for l in ts:
        if 'URI' in l:
            keyUrl = re.findall(r'URI=".*?"',l)[0]
            break
    
    origin_url = m3u8_file_url[0:m3u8_file_url.index('voddrm')]
    #获取完整的url
    keyUrl = keyUrl.replace('URI=','').replace('"','')
    #print(keyUrl)
    ts_lines = [origin_url + line.replace('\n','')   for line in ts if 'start=' in line]
    #print(len(ts_lines),ts_lines[0])
    d_ts_decrypt(key_url=keyUrl,ts_urls=ts_lines,folder = index)
    #return keyUrl,ts_lines

m3u8_files = [
J2h0dHBzOi8vMTI1ODcxMjE2Ny52b2QyLm15cWNsb3VkLmNvbS8yNTEyMWE2YXZvZHRyYW5zYmoxMjU4NzEyMTY3L2U4ZWE1MDA5Mzg3NzAyMzA2NDkzMTIwMDY3L2RybS92b2Rkcm0udG9rZW4uZFdsdVBURTBOREV4TlRNM09UTXpNRFl4TlRjM09UdGxlSFE5TWpGaVpHRTRZamhsWlRSaU9EazNaalE0TnpOaU5XRmpZbVUwTldNd01qTXpaV1UyTlRJNVpqa3dObUl5T1dZelpUTTNaakUxTkRnMlltVTJNRFF6TVRKalptRTBOemxpT1RVM09UazBORFV4WldWaU0yUTJPV1UzTVRneVlqWXlOR0l3Wm1Sa05XWTVaR1k1WkdVeU0yWmpaVGhoTlRBeFpHVTJNbUZrTXpSalpqRTFNVEJrTWpFellqRTJNMlpoTzNWcFpGOTBlWEJsUFRJN2RXbGtYMjl5YVdkcGJsOTFhV1JmZEhsd1pUMHlPM1ZwWkY5dmNtbG5hVzVmWVhWMGFGOTBlWEJsUFRJN2RXbGtYMkZ3Y0dsa1BURTBNREF3TURBd01EZzdZMmxrUFRVNE9USTJPRGs3ZEdWeWJWOXBaRDB4TURZeE1EazVOekU3ZG05a1gzUjVjR1U5TUR0d2JHRjBabTl5YlQwei52LmYzMDc0Mi5tM3U4P2V4cGVyPTAmc2lnbj00MjA1NGZmMTk5MzliYzE1ZDEzNTY2NDYyZDg2MzNmMiZ0PTY0MkJDQjdEJnVzPTYxNTE3Mzg0OTMyNjIyNjI0MDEnLA
]

i = 0
for mf in m3u8_files:
    ''''''
    i = i + 1
    deal(mf,str(i))
    #break

上面代码下载的文件,应该可以播放了;但是文件很碎,如果需要合成,建议使用ffmpeg命令;

首先需要将所有文件索引放到一个文件中;
通过以下批处理命令实现:

(for %i in ( *.ts ) do @echo file '%i') > list.txt

通过FFMPEG的合并视频的命令生成一个完整的视频;

ffmpeg -f concat -safe 0 -i list.txt -c copy output.mp4
相关文章
|
5天前
|
存储 Python
一文让你搞懂 Python 的 pyc 文件
一文让你搞懂 Python 的 pyc 文件
28 15
|
4天前
|
调度 开发者 UED
探索Python中的异步编程:从基础到实战
【9月更文挑战第30天】在编程的世界里,异步编程是一个强大的概念,它允许程序在等待某些操作完成时继续执行其他任务。本文将深入探讨Python中的异步编程,从理解其基本概念开始,逐步过渡到高级应用。我们将通过具体的代码示例来展示如何在实际项目中实现异步功能,从而提高应用程序的性能和响应性。无论你是初学者还是有经验的开发者,这篇文章都将为你提供宝贵的见解和实用技巧。
|
2天前
|
存储 数据处理 开发者
深入浅出:Python编程基础与实战技巧
【9月更文挑战第32天】本文将引导读者从零开始,掌握Python编程语言的核心概念,并通过实际代码示例深入理解。我们将逐步探索变量、数据结构、控制流、函数、类和异常处理等基本知识,并结合实用案例,如数据处理、文件操作和网络请求,提升编程技能。无论您是初学者还是有一定经验的开发者,这篇文章都能帮助您巩固基础,拓展视野。
|
1天前
|
SQL 数据采集 数据可视化
深入 Python 数据分析:高级技术与实战应用
本文系统地介绍了Python在高级数据分析中的应用,涵盖数据读取、预处理、探索及可视化等关键环节,并详细展示了聚类分析、PCA、时间序列分析等高级技术。通过实际案例,帮助读者掌握解决复杂问题的方法,提升数据分析技能。使用pandas、matplotlib、seaborn及sklearn等库,提供了丰富的代码示例,便于实践操作。
101 64
|
1天前
|
数据采集 存储 数据挖掘
深入探索 Python 爬虫:高级技术与实战应用
本文介绍了Python爬虫的高级技术,涵盖并发处理、反爬虫策略(如验证码识别与模拟登录)及数据存储与处理方法。通过asyncio库实现异步爬虫,提升效率;利用tesseract和requests库应对反爬措施;借助SQLAlchemy和pandas进行数据存储与分析。实战部分展示了如何爬取电商网站的商品信息及新闻网站的文章内容。提醒读者在实际应用中需遵守法律法规。
100 66
|
2天前
|
设计模式 开发者 Python
探索Python中的异步编程:从基础到实战
【9月更文挑战第32天】在Python的世界中,异步编程是一种让程序在等待任务完成时不阻塞的技术。本文将通过浅显易懂的方式,带领读者了解异步编程的核心概念、常用库及其在实际项目中的应用。我们将从异步IO的基础知识出发,逐步深入到asyncio库的使用,最后通过一个简易Web服务器的示例,演示如何将理论应用到实践中。文章旨在为初学者提供一个清晰的学习路径,帮助他们掌握Python异步编程的精髓。
|
5天前
|
Python
Python sorted() 函数和sort()函数对比分析
Python sorted() 函数和sort()函数对比分析
|
1天前
|
机器学习/深度学习 人工智能 数据可视化
Python比较适合哪些场景的编程?
Python比较适合哪些场景的编程?
14 7
|
6天前
|
数据挖掘 索引 Python
Python数据挖掘编程基础3
字典在数学上是一个映射,类似列表但使用自定义键而非数字索引,键在整个字典中必须唯一。可以通过直接赋值、`dict`函数或`dict.fromkeys`创建字典,并通过键访问元素。集合是一种不重复且无序的数据结构,可通过花括号或`set`函数创建,支持并集、交集、差集和对称差集等运算。
15 9
|
1天前
|
大数据 Python
Python 高级编程:深入探索高级代码实践
本文深入探讨了Python的四大高级特性:装饰器、生成器、上下文管理器及并发与并行编程。通过装饰器,我们能够在不改动原函数的基础上增添功能;生成器允许按需生成值,优化处理大数据;上下文管理器确保资源被妥善管理和释放;多线程等技术则助力高效完成并发任务。本文通过具体代码实例详细解析这些特性的应用方法,帮助读者提升Python编程水平。
18 5
下一篇
无影云桌面