Crawler:基于requests库+urllib3库+伪装浏览器实现爬取抖音账号的信息数据

简介: Crawler:基于requests库+urllib3库+伪装浏览器实现爬取抖音账号的信息数据

输出结果


更新……



代码设计


from contextlib import closing

import requests, json, time, re, os, sys, time

import urllib3

urllib3.disable_warnings(urllib3.exceptions.InsecureRequestWarning)

headers = {

  'accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8',

  'accept-encoding': 'gzip, deflate, br',

  'accept-language': 'zh-CN,zh;q=0.9',

  'cache-control': 'max-age=0',

  'upgrade-insecure-requests': '1',

  'user-agent': 'Mozilla/5.0 (Linux; U; Android 5.1.1; zh-cn; MI 4S Build/LMY47V) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 Chrome/53.0.2785.146 Mobile Safari/537.36 XiaoMi/MiuiBrowser/9.1.3',

 }

class DouYin(object):

   def __init__(self, width=500, height=300):

       """

       抖音App视频下载

       """

       # 无头浏览器

       chrome_options = Options()

       chrome_options.add_argument(

   def get_video_urls(self, user_id):

       """

       获得视频播放地址

       Parameters:

           user_id:查询的用户ID

       Returns:

           video_names: 视频名字列表

           video_urls: 视频链接列表

           nickname: 用户昵称

       """

   def video_downloader(self,video_urls, video_names, watermark_flag=False):

       for i in range(len(video_urls)):

           try:

               video_url = video_urls[i]

   def run(self):

       user_id = input('请输入ID(例如108561773):')

if __name__ == '__main__':

   douyin = DouYin()

   douyin.run()



相关文章
|
6月前
|
Web App开发 Python
在ModelScope中,你可以使用Python的浏览器自动化库
在ModelScope中,你可以使用Python的浏览器自动化库
72 2
|
3月前
|
Web App开发
成功解决Chrome浏览器 控制台下看不到接口信息的问题
这篇文章提供了解决Chrome浏览器控制台不显示接口信息问题的方法,包括检查过滤设置和确保“保留日志”开关已打开。
成功解决Chrome浏览器 控制台下看不到接口信息的问题
|
4月前
|
机器人 Shell 开发者
`roslibpy`是一个Python库,它允许非ROS(Robot Operating System)环境(如Web浏览器、移动应用等)与ROS环境进行交互。通过使用`roslibpy`,开发者可以编写Python代码来远程控制ROS节点,发布和订阅话题,以及调用服务。
`roslibpy`是一个Python库,它允许非ROS(Robot Operating System)环境(如Web浏览器、移动应用等)与ROS环境进行交互。通过使用`roslibpy`,开发者可以编写Python代码来远程控制ROS节点,发布和订阅话题,以及调用服务。
|
3月前
|
存储 PHP Windows
Typecho——非插件方式实现评论显示系统信息和浏览器信息
Typecho——非插件方式实现评论显示系统信息和浏览器信息
39 0
|
4月前
|
JavaScript
vue 组件封装 | 随鼠标移动的信息框 (含监听鼠标移动、移出事件,获取元素的宽高、获取浏览器的宽高)
vue 组件封装 | 随鼠标移动的信息框 (含监听鼠标移动、移出事件,获取元素的宽高、获取浏览器的宽高)
48 1
|
5月前
|
安全 JavaScript 前端开发
恶意软件警报:BitRAT和Lumma Stealer伪装成假浏览器更新
恶意软件警报:BitRAT和Lumma Stealer伪装成假浏览器更新
Edge浏览器控制台(F12)中网络不显示接口信息
Edge浏览器控制台(F12)中网络不显示接口信息
|
6月前
利用arpspoof工具获取内网浏览器信息
利用arpspoof工具获取内网浏览器信息
40 1
|
17天前
|
JSON 移动开发 JavaScript
在浏览器执行js脚本的两种方式
【10月更文挑战第20天】本文介绍了在浏览器中执行HTTP请求的两种方式:`fetch`和`XMLHttpRequest`。`fetch`支持GET和POST请求,返回Promise对象,可以方便地处理异步操作。`XMLHttpRequest`则通过回调函数处理请求结果,适用于需要兼容旧浏览器的场景。文中还提供了具体的代码示例。
在浏览器执行js脚本的两种方式
|
15天前
|
机器学习/深度学习 自然语言处理 前端开发
前端神经网络入门:Brain.js - 详细介绍和对比不同的实现 - CNN、RNN、DNN、FFNN -无需准备环境打开浏览器即可测试运行-支持WebGPU加速
本文介绍了如何使用 JavaScript 神经网络库 **Brain.js** 实现不同类型的神经网络,包括前馈神经网络(FFNN)、深度神经网络(DNN)和循环神经网络(RNN)。通过简单的示例和代码,帮助前端开发者快速入门并理解神经网络的基本概念。文章还对比了各类神经网络的特点和适用场景,并简要介绍了卷积神经网络(CNN)的替代方案。

热门文章

最新文章

下一篇
无影云桌面