头条搜索精选 参数分析

简介: 头条搜索精选 参数分析
本文所有教程及源码、软件仅为技术研究。不涉及计算机信息系统功能的删除、修改、增加、干扰,更不会影响计算机信息系统的正常运行。不得将代码用于非法用途,如侵立删!

头条搜索精选 参数分析

环境

  • win10
  • Python3.9
  • Chrome

抓包接口分析

主要是需要这一块的内容通过抓包分析发现在html中直接有json数据现在只需要请求页面然后提取出需要的json数据即可,现在重点分析一下请求所需的参数,经过测试得知,ttwid是必要参数,看长度和验证流程和dy极为相似,直接用dy的套一下测试发现是一样的。

cookies= {

   # "tt_webid": "7221851119085061689",

   # "_ga": "GA1.1.1371017124.1681468304",

   # "passport_csrf_token": "086bf595bf03413a64b6250e818f8861",

   # "_ga_QEHZPBE5HH": "GS1.1.1687776009.2.0.1687776009.0.0.0",

   "ttwid": "1%7C22KnJ4OamTx5lIoxDKM-JBA_0MZigRB0iOvI-ouOU%7C1687776011%7C5a059c3a4eaa05094b2389065993850c62df3b6095a3b5b9abb6ebbbd781d4",

   # "_tea_utm_cache_4916": "undefined",

   # "_S_WIN_WH": "1366_657",

   # "_S_DPR": "1",

   # "_S_IPAD": "0",

   "s_v_web_id": "verify_ljcqae1y_flG7UGHi_j6mx_4ZjM_8dt3_z9Lxvp74pqk5"

}

ttwid生成

验证流程:1.先获取ac_nonce 2.根据ac_nonce本地生成ac_signature 3.使用ac_nonce和__ac_signature 获取ttwid

headers_base= {

       "Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9",

       "Accept-Language": "zh-CN,zh;q=0.9,en-US;q=0.8,en;q=0.7",

       "Cache-Control": "no-cache",

       "Connection": "keep-alive",

       "Pragma": "no-cache",

       "Sec-Fetch-Dest": "document",

       "Sec-Fetch-Mode": "navigate",

       "Sec-Fetch-Site": "none",

       "Sec-Fetch-User": "?1",

       "Upgrade-Insecure-Requests": "1",

       "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/104.0.0.0 Safari/537.36",

       "sec-ch-ua": "\"Chromium\";v=\"104\", \" Not A;Brand\";v=\"99\", \"Google Chrome\";v=\"104\"",

       "sec-ch-ua-mobile": "?0",

       "sec-ch-ua-platform": "\"Windows\""

   }

   url=f"https://www.toutiao.com/"

   # sess.mount(url , CipherAdapter())

   __ac_nonce=sess.get(url, headers=headers_base).cookies.get('__ac_nonce')

   print(__ac_nonce)

   __ac_signature=get_ac_sign(__ac_nonce)

   print(__ac_signature)

   headers= {

       'cookie': f'__ac_nonce={__ac_nonce}; __ac_signature={__ac_signature};

       'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/100.0.4896.60 Safari/537.36'

   }

   ttwid=requests.get(headers=headers).cookies.get('ttwid')

   print(ttwid)

效果

资源下载

https://download.csdn.net/download/qq_38154948/87951323


本文仅供学习交流使用,如侵立删!


相关文章
|
6月前
|
关系型数据库 MySQL 网络安全
小课堂 -- shodan搜索
小课堂 -- shodan搜索
57 0
|
6月前
|
搜索推荐 API 开发工具
技术写作与内容研究:主题得分、关键词搜索量、社区和论坛策略
内容研究涉及对特定主题进行系统的调查,以收集可靠和相关的信息。这个过程对于技术作者来说至关重要,因为它有助于生成有价值的、准确的、信息丰富的和引人入胜的内容。它超越了基本的互联网搜索,包括阅读技术文档、采访专家、进行调查和分析数据。内容研究应以战略方式进行,考虑信息的用途、目标受众和要传达的关键信息。一个执行良好的内容研究过程可以帮助技术作者生成既清晰又简洁的高质量内容。
135 2
|
Web App开发 XML JavaScript
【原创】淘宝关键词搜索爬取与解析
【原创】淘宝关键词搜索爬取与解析
【原创】淘宝关键词搜索爬取与解析
|
SQL 机器学习/深度学习 自然语言处理
行业搜索最佳实践(一)|学习笔记
快速学习行业搜索最佳实践(一)
225 1
行业搜索最佳实践(一)|学习笔记
|
Python
百度搜索的高级用法
百度搜索的高级用法
2991 0
百度搜索的高级用法
|
自然语言处理 搜索推荐 算法
行业搜索最佳实践(二)|学习笔记
快速学习行业搜索最佳实践(二)
108 0
|
自然语言处理 分布式计算 监控
六十五、Spark-综合案例(搜狗搜索日志分析)
六十五、Spark-综合案例(搜狗搜索日志分析)
六十五、Spark-综合案例(搜狗搜索日志分析)
|
搜索推荐 关系型数据库 MySQL
利用Xunsearch搭建搜索引擎、内容搜索实战
利用Xunsearch搭建搜索引擎、内容搜索实战
321 0
利用Xunsearch搭建搜索引擎、内容搜索实战
|
Python
还在被人说“你不会百度吗”,行哥介绍8种百度搜索高级语法技巧(建议收藏)...
昨天知乎有个“你不会百度吗”的问题上了热搜,这句话在很多技术群里会经常出现,毕竟对于基础问题百度图文并茂,比直接问人快多了。所以不出意外该问题下3430个回答基本每个人都有说过这句话,从情从理一同分析猛如虎。但是都没考虑这个提问者会不会百度,也许刚通网呢?
770 0
还在被人说“你不会百度吗”,行哥介绍8种百度搜索高级语法技巧(建议收藏)...
下一篇
无影云桌面