请问一下关于php采集百度知道的问题? 400 报错
php用fsockopen和curl都测试过了,当采集的时候百度知道里面的内容会被替换成图片显示.发送的请求头部一致.我想请问一下这种该如何解决.搞的非常纠结.麻烦知道的大神详细的了解一下,并提供一个方法,非常感谢.
你需要仔细观察浏览器和百度交互的过程,
完全模拟出来才有可能不被百度阴掉.
######回复 @ffvsnn520 : 你确定你组合了所有的数据没有任何遗漏?不行就抓包看看, 比较一下有什么不同######回复 @甘薯 : 这个已经用了.我用的是firebug把请求头部都写到里面了。curl和fsockopen都尝试了.因为还是没办法所以才到这里来请教.感觉真的很奇怪。######回复 @ffvsnn520 : 你观察一下浏览器和百度交互的过程, 把浏览器请求数据和cookie之类的东西都复制到你的线上请求, 这样百度应该会认为你的请求是一个普通的浏览器就不会发图片给你了.######你好,求助一下.不知道他是用什么来判定我是采集的.我把页面下载到本地,然后采集是没有问题的.但是用线上的链接采集,文字就会变成图片....这个应该不是交互而是服务器里面有什么其他的设置吧...不是很清楚,所以请教一下.多谢版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。