头条搜索精选 参数分析

简介: 头条搜索精选 参数分析
本文所有教程及源码、软件仅为技术研究。不涉及计算机信息系统功能的删除、修改、增加、干扰,更不会影响计算机信息系统的正常运行。不得将代码用于非法用途,如侵立删!

头条搜索精选 参数分析

环境

  • win10
  • Python3.9
  • Chrome

抓包接口分析

主要是需要这一块的内容通过抓包分析发现在html中直接有json数据现在只需要请求页面然后提取出需要的json数据即可,现在重点分析一下请求所需的参数,经过测试得知,ttwid是必要参数,看长度和验证流程和dy极为相似,直接用dy的套一下测试发现是一样的。

cookies= {

   # "tt_webid": "7221851119085061689",

   # "_ga": "GA1.1.1371017124.1681468304",

   # "passport_csrf_token": "086bf595bf03413a64b6250e818f8861",

   # "_ga_QEHZPBE5HH": "GS1.1.1687776009.2.0.1687776009.0.0.0",

   "ttwid": "1%7C22KnJ4OamTx5lIoxDKM-JBA_0MZigRB0iOvI-ouOU%7C1687776011%7C5a059c3a4eaa05094b2389065993850c62df3b6095a3b5b9abb6ebbbd781d4",

   # "_tea_utm_cache_4916": "undefined",

   # "_S_WIN_WH": "1366_657",

   # "_S_DPR": "1",

   # "_S_IPAD": "0",

   "s_v_web_id": "verify_ljcqae1y_flG7UGHi_j6mx_4ZjM_8dt3_z9Lxvp74pqk5"

}

ttwid生成

验证流程:1.先获取ac_nonce 2.根据ac_nonce本地生成ac_signature 3.使用ac_nonce和__ac_signature 获取ttwid

headers_base= {

       "Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9",

       "Accept-Language": "zh-CN,zh;q=0.9,en-US;q=0.8,en;q=0.7",

       "Cache-Control": "no-cache",

       "Connection": "keep-alive",

       "Pragma": "no-cache",

       "Sec-Fetch-Dest": "document",

       "Sec-Fetch-Mode": "navigate",

       "Sec-Fetch-Site": "none",

       "Sec-Fetch-User": "?1",

       "Upgrade-Insecure-Requests": "1",

       "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/104.0.0.0 Safari/537.36",

       "sec-ch-ua": "\"Chromium\";v=\"104\", \" Not A;Brand\";v=\"99\", \"Google Chrome\";v=\"104\"",

       "sec-ch-ua-mobile": "?0",

       "sec-ch-ua-platform": "\"Windows\""

   }

   url=f"https://www.toutiao.com/"

   # sess.mount(url , CipherAdapter())

   __ac_nonce=sess.get(url, headers=headers_base).cookies.get('__ac_nonce')

   print(__ac_nonce)

   __ac_signature=get_ac_sign(__ac_nonce)

   print(__ac_signature)

   headers= {

       'cookie': f'__ac_nonce={__ac_nonce}; __ac_signature={__ac_signature};

       'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/100.0.4896.60 Safari/537.36'

   }

   ttwid=requests.get(headers=headers).cookies.get('ttwid')

   print(ttwid)

效果

资源下载

https://download.csdn.net/download/qq_38154948/87951323


本文仅供学习交流使用,如侵立删!


相关文章
|
5月前
|
关系型数据库 MySQL 网络安全
小课堂 -- shodan搜索
小课堂 -- shodan搜索
52 0
|
5月前
|
搜索推荐 API 开发工具
技术写作与内容研究:主题得分、关键词搜索量、社区和论坛策略
内容研究涉及对特定主题进行系统的调查,以收集可靠和相关的信息。这个过程对于技术作者来说至关重要,因为它有助于生成有价值的、准确的、信息丰富的和引人入胜的内容。它超越了基本的互联网搜索,包括阅读技术文档、采访专家、进行调查和分析数据。内容研究应以战略方式进行,考虑信息的用途、目标受众和要传达的关键信息。一个执行良好的内容研究过程可以帮助技术作者生成既清晰又简洁的高质量内容。
98 2
|
Web App开发 XML JavaScript
【原创】淘宝关键词搜索爬取与解析
【原创】淘宝关键词搜索爬取与解析
【原创】淘宝关键词搜索爬取与解析
|
存储 JSON 数据格式
【原创】抖音关键词搜索
【原创】抖音关键词搜索
【原创】抖音关键词搜索
|
Python
百度搜索的高级用法
百度搜索的高级用法
2940 0
百度搜索的高级用法
抖音搜索里的百科词条是什么百科?头条搜索里的百科怎么做?
抖音搜索里的百科词条是什么百科?头条搜索里的百科怎么做?
169 0
|
Python
还在被人说“你不会百度吗”,行哥介绍8种百度搜索高级语法技巧(建议收藏)...
昨天知乎有个“你不会百度吗”的问题上了热搜,这句话在很多技术群里会经常出现,毕竟对于基础问题百度图文并茂,比直接问人快多了。所以不出意外该问题下3430个回答基本每个人都有说过这句话,从情从理一同分析猛如虎。但是都没考虑这个提问者会不会百度,也许刚通网呢?
690 0
还在被人说“你不会百度吗”,行哥介绍8种百度搜索高级语法技巧(建议收藏)...
|
前端开发 JavaScript 搜索推荐
如何正确的使用百度精准搜索
如何正确的使用百度精准搜索
519 0
|
移动开发 前端开发 weex
详解|天猫搜索前端技术历代记
作者从 17 年双十一前开始接手天猫搜索前端,开发第一个需求—— H5 凑单页,到今天已经将近两年了。在这两年里,天猫搜索的前端体系发生了比较大的变化。今天分享一篇阶段性的总结文章,记录天猫搜索前端技术的过去、现在,以及自己作为业务目前的唯一前端对未来的思考。
2694 0
详解|天猫搜索前端技术历代记
|
自然语言处理 运维 搜索推荐
精选案例 | “虫虫音乐”如何做到搜索CTR提高150%
简介: 本文通过【虫虫音乐】在阿里云开放搜索的最佳实践,和大家介绍影音行业如何快速实现高质量的搜索服务助力业务更好发展!
940 0
精选案例 | “虫虫音乐”如何做到搜索CTR提高150%