Python批量爬取抖音/快手/B站视频(附源码和exe)

简介: 但是最近行哥需要进行批量下载抖音/快手等网站的视频,如果手动输入代码下载不是很方便。所以行哥希望先把要下载的视频地址统一放到一个txt文件里,之后再通过这个txt文件进行批量下载


去年行哥给大家介绍了一行Python代码下载各大网站的视频(公开视频),使用的工具包是you-get,具体使用方法如下:image.png

但是最近行哥需要进行批量下载抖音/快手等网站的视频,如果手动输入代码下载不是很方便。所以行哥希望先把要下载的视频地址统一放到一个txt文件里,之后再通过这个txt文件进行批量下载

   1.Python代码详解

   2.exe直接使用版本

1.Python代码详解

首先这个项目通过Python爬虫,返回一定格式的信息,并使用flask提供简易api进行下载。可下载各平台的视频、音乐和封面图片,只要有链接地址,它就能下载。具体可下载的平台和素材:image.png

上下滚动查看更多

核心代码如下,先读出txt文件里的内容并提取出其中的所有网址,之后进行解析生成对应的视频、音乐和图片下载地址,最后将地址里的内容进行下载,同时使用了多线程加快代码的批量下载速度

   

    path = "./一行数据公众号/爬取抖音/批量下载链接.txt"
    with open(path, 'r') as f:
        what = f.read()
    for i in "1":
        urls = parse_urls(what)
        if not urls:
            print("bye~")
            break
        print(f"""
╭━━━━━━━━━━━━━╮
│ 一共{len(urls)}个链接 │
╰━━━━━━━━━━━━━╯
        """)
        all_task = []
        for idx, url in enumerate(urls):
            print(f"正在解析第{idx+1}个链接【{url}】")
            data = get_data(url)
            if data:
                all_task.extend(data2tasks(data))
        queue = Queue(maxsize=100)
        for t in all_task:
            queue.put(t)
        ts = [Thread(target=dl, args=(queue, )) for _ in range(min(len(all_task), 6))]
        for t in ts:
            t.start()
        for t in ts:
            t.join()

   

运行结果如下:image.png

源码地址是:https://github.com/XiyaoWong/spiders,本文行哥对这位大佬的代码进行修改和封装,大家需要的话可以下载下来学习

2.Exe直接使用版本

行哥为了方便不会Python的读者使用,将其封装成了exe版本,只需要三个步骤就可以批量下载各大平台视频素材image.png

   1.点击【选择链接txt文件】,选择已保存很多链接的txt文件,例如image.png

   2.点击【选择路径】设置保存视频素材的文件地址

   3.点击【开始爬取】,下载进度会在命令窗口里实时显示

最终的exe下载结果如下,爬取下来的文件分别保存在videos(视频)和audios(音频)两个文件夹内,其中的视频皆为无水印版本:image.png

这个自动批量爬取视频的exe后台回复【一行08】可以获得

3.最后

现在在平台里按照某个id或分区的所有视频整体爬取还在开发中,有了解的读者可以来给行哥投稿哦,行哥撒币


相关文章
|
1月前
|
区块链 Python
最详细Python打包exe教程,并修改图标,只需30秒
最详细Python打包exe教程,并修改图标,只需30秒
56 4
最详细Python打包exe教程,并修改图标,只需30秒
|
19天前
|
Ubuntu Linux 数据安全/隐私保护
使用Cython库包对python的py文件(源码)进行加密,把python的.py文件生成.so文件并调用
本文介绍了在Linux系统(Ubuntu 18.04)下将Python源代码(`.py文件`)加密为`.so文件`的方法。首先安装必要的工具如`python3-dev`、`gcc`和`Cython`。然后通过`setup.py`脚本使用Cython将`.py文件`转化为`.so文件`,从而实现源代码的加密保护。文中详细描述了从编写源代码到生成及调用`.so文件`的具体步骤。此方法相较于转化为`.pyc文件`提供了更高的安全性。
31 2
|
25天前
|
测试技术 Python
python自动化测试中装饰器@ddt与@data源码深入解析
综上所述,使用 `@ddt`和 `@data`可以大大简化写作测试用例的过程,让我们能专注于测试逻辑的本身,而无需编写重复的测试方法。通过讲解了 `@ddt`和 `@data`源码的关键部分,我们可以更深入地理解其背后的工作原理。
22 1
|
1月前
|
JSON 算法 API
京东以图搜图功能API接口调用算法源码python
京东图搜接口是一款强大工具,通过上传图片即可搜索京东平台上的商品。适合电商平台、比价应用及需商品识别服务的场景。使用前需了解接口功能并注册开发者账号获取Key和Secret;准备好图片的Base64编码和AppKey;生成安全签名后,利用HTTP客户端发送POST请求至接口URL;最后解析JSON响应数据以获取商品信息。
|
1月前
|
开发者 Python
深入解析Python `httpx`源码,探索现代HTTP客户端的秘密!
深入解析Python `httpx`源码,探索现代HTTP客户端的秘密!
65 1
|
1月前
|
开发者 Python
深入解析Python `requests`库源码,揭开HTTP请求的神秘面纱!
深入解析Python `requests`库源码,揭开HTTP请求的神秘面纱!
120 1
|
18天前
|
TensorFlow 算法框架/工具 C++
Python exe文件打包神器-Nuitka!
Python exe文件打包神器-Nuitka!
|
19天前
|
区块链 Python
Python脚本打包 exe,auto-py-to-exe来帮你!
Python脚本打包 exe,auto-py-to-exe来帮你!
|
19天前
|
算法 关系型数据库 程序员
程序员必备技能)基于Python的鼠标与键盘控制实战扩展与源码
这篇文章是关于如何使用Python的`pyautogui`库来控制鼠标和键盘进行各种操作,包括移动、点击、滚轮控制以及键盘的按键和快捷键输出,并介绍了如何结合图像处理和计算机视觉技术来扩展其应用。
|
1月前
|
Linux 数据安全/隐私保护 Python
LInux下 python混淆代码打包产出exe
安装 PyArmor 加密Python程序:使用`pip install pyarmor`。为避免混淆 venv 目录,可指定排除此目录:`.\/venv\/bin\/pyarmor-7 pack -e \"--onefile\" -x \"--exclude venv\" main.py`。查阅详细文档:[官方指南](https://pyarmor.readthedocs.io/zh/v7.x/advanced.html)。