用PHP抓取一个网页,但是这个网页需要登录之后才能显示出来,登录的时候有数字验证码。怎么才能抓取这个页面呢?有什么很好的方法吗?
curl模拟登录时保存cookie,再用curl去打开需要抓去的网页。
下面对于登录需要验证码的,简单的,暂时性的办法,要自动化还是需要识别验证码:
或者直接获取cookie(从浏览器里面查看,不过一般有时间限制),加在header里面,然后访问你需要抓取的页面。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。