如何获取视频网站的信息(土豆例子)

简介: 现在不少的视频网站都提供转载视频的功能 我之前写过一篇CHSNS#中通过youku的视频网址获取视频截图及视频信息,虽然可能地址已经改了但却未涉及土豆网,其实土豆获取的方法与优酷是差不多的。 http://www.

现在不少的视频网站都提供转载视频的功能

我之前写过一篇CHSNS#中通过youku的视频网址获取视频截图及视频信息,虽然可能地址已经改了但却未涉及土豆网,其实土豆获取的方法与优酷是差不多的。

http://www.tudou.com/

其中的一个视频

http://www.tudou.com/programs/view/OiokB0Rohag/

我选择贴到博客,然后复制Flash播放器地址

image

 

这样我们使用这个地址(http://www.tudou.com/v/OiokB0Rohag)访问时就可以看到单个 的Flash

我们在使用火狐打开页面前打开FireBug,就可以分析到加载Flash前加载了一些数据。

我们可以看到其页面跳转到了http://www.tudou.com/player/outside/player_outside.swf?iid=42471321&default_skin=http://js.tudouui.com/bin/player2/outside/Skin_outside_17.swf&autostart=false&rurl=

而其中42471321应该就是视频的Id

在程序中,这个我们可以通过一个简单的WebRequest来读取。到而重定向的值一般在Header的Location中。

在播放视频后我们查看获取的文件看到有一个地址类似下面这个,(在程序中我们直接获取即可,nocatch只与FlV的HashKey有关,我们要获取的是基本信息可以不必管)

http://v2.tudou.com/v2/cdn?noCatch=22538&safekey=YouNeverKnowThat&refurl=&id=42471321

的文件,它的内容为:

<v time="279930" vi="1" ch="99" nls="0" title="&#20339;&#26408;&#26031;&#22823;&#23398;&#26657;&#22253;&#39118;&#26223;" code="OiokB0Rohag" enable="1" logo="0" wt="0" band="0"><a><f w="50" h="0" sha1="36389a32217fb6c47d048f22b175e0e36b4177c9" size="9972374"> http://218.60.33.9/wwwFlv/flv/042/471/321/42471321.36389a32217fb6c47d048f22b175e0e36b4177c9_238_6.flv?key=dd52145474b8e47a02506e4b286d0607ee1a08&amp;id=tudou&amp;itemid=42471321</f></a><b><f w="1" h="0" sha1="36389a32217fb6c47d048f22b175e0e36b4177c9" size="9972374"> http://125.211.196.4/wwwFlv/flv/042/471/321/42471321.36389a32217fb6c47d048f22b175e0e36b4177c9_238_6.flv?key=dd52145474b8e47a02506e4b286d0607ee1a08&amp;id=tudou&amp;itemid=42471321</f><f w="1" h="0" sha1="36389a32217fb6c47d048f22b175e0e36b4177c9" size="9972374"> http://119.147.178.9/wwwFlv/flv/042/471/321/42471321.36389a32217fb6c47d048f22b175e0e36b4177c9_238_6.flv?key=dd52145474b8e47a02506e4b286d0607ee1a08&amp;id=tudou&amp;itemid=42471321</f></b></v>

 

其中Time是播放时间而Title是影片名的Unicode形式,code就是影片的编码我们可以看到前面的也几乎就是这个形式。

至于图片,其实在这里没有直接提供但是我们也可以根据其它的图片推算出来

http://i01.img.tudou.com/data/imgs/i/042/471/321/p.jpg 为其图片地址

4247132是其Id,结合方法应该很容易看的出来

目录
相关文章
|
17天前
|
人工智能 自然语言处理 监控
AI+RPA全解析:从技术原理到行业落地,一篇读懂智能自动化核心密码
AI+RPA融合人工智能与机器人流程自动化,正重塑企业效率。它无需改造系统,即可跨平台自动处理财务、人力、运营等重复性工作,提效降本,助力数字化转型。从发票核验到简历筛选,从数据采集到合规申报,实现“智能决策+自动执行”。实在Agent等新一代智能体更支持自然语言指令、自主规划任务,已在金融、制造、政务等领域规模化落地,成为企业提质增效的刚需工具。
|
分布式计算 并行计算 编译器
NumPy 高级教程——并行计算
NumPy 高级教程——并行计算【1月更文挑战第3篇】
816 26
|
存储 Ubuntu 关系型数据库
Ubuntu安装MySQL 8.0与Navicat
Ubuntu安装MySQL 8.0 1、更新软件包列表 在添加 MySQL APT 存储库后,运行以下命令以更新软件包列表: sudo apt update 2、安装 MySQL 8.0 现在,你可以使用以下命令来安装 MySQL 8.0: sudo apt install mysql-server-8.0 在安装 MySQL 8.0(或其他软件包)时,通常不会显示密码,因为安装过程不需要您提供密码。安装过程中可能会提示您设置 MySQL root 用户的密码,但这是在 MySQL 服务器配置的步骤中完成的,而不是在 apt 安装命令中提供的。
1018 0
|
5月前
|
人工智能 运维 自然语言处理
首个智能体模型实测:产品、开发、运维“全包了”
2025年,AI进入“动手”时代。智谱发布新一代大模型GLM-4.5,全球排名第三、国产第一,专为智能体设计,融合推理、编码与智能体能力,实现自主规划与执行任务。通过8个Demo展示其强大能力,涵盖网页设计、课件制作、小游戏开发等,展现其“带手的脑”特性,推动AI从实验室走向真实场景。
299 0
|
5月前
|
存储 安全 固态存储
蓝屏代码太多看不懂?这里有解决方案
在使用 Windows 系统时,蓝屏是常见问题。蓝屏代码如“CRITICAL_PROCESS_DIED”或“0x0000007E”等,提示错误类型与原因。本文详解常见蓝屏代码含义及修复方法,帮助用户快速定位问题根源,避免盲目重装系统,提升排查效率。
|
PyTorch 测试技术 算法框架/工具
【YOLOv8改进 - 卷积Conv】SPConv:去除特征图中的冗余,大幅减少参数数量 | 小目标
YOLO目标检测专栏探讨了模型优化,提出SPConv,一种新卷积操作,减少特征冗余,提升效率。SPConv将特征分为代表性和不确定部分,分别处理,再融合。实验显示,SPConv在速度和准确性上超越现有基准,减少FLOPs和参数。论文和PyTorch代码已公开。更多详情及实战案例见CSDN博客链接。
|
机器学习/深度学习 数据可视化 Python
No module named 'pytorch_wavelets'问题如何解决
【6月更文挑战第21天】No module named 'pytorch_wavelets'问题如何解决
1778 0
|
编解码 文字识别 Linux
PyMuPDF 1.24.4 中文文档(十三)(3)
PyMuPDF 1.24.4 中文文档(十三)
684 0
|
机器学习/深度学习 人工智能 自然语言处理
AI编程发展历史回顾:从孕育到普及的演进轨迹
AI编程发展历史回顾:从孕育到普及的演进轨迹
1081 4
|
C++
Visual C++ Build Tools 2015 安装包丢失或损坏[解决方案]
Visual C++ Build Tools 2015 安装包丢失或损坏[解决方案]
1431 0