开发者社区> 问答> 正文

【求助】 网页爬虫问题 用python,谢谢老大些。。。? 400 报错

【求助】 网页爬虫问题 用python,谢谢老大些。。。? 400 报错

我要爬的网站是这个:https://malwr.com,上面有很多样本可以下载。

登录成功后,上面有很多url链接,点击后,这些url还要跳到一个页面去,哪里有一个download可以下载那些样本。

我看了下,它的登录方式是用的ajax形式,它要post的数据是:

csrfmiddlewaretoken a3H8JNXDmWGkNnIzWiwrNfDkn58QgN7n

username xxxxx

password xxxx

next

其中,csrfmiddlewaretoken 这个东东完全不知道怎么构建,对于python完全不熟悉呀,想用爬虫下载那些,免得手动下载,哪位好心人,可以给点思路呀,它们说python很好做,可我没入门,想写这个爬虫,很棘手呀,好心人,能帮帮忙吗,谢谢咯!!!!


 

展开
收起
爱吃鱼的程序员 2020-06-01 11:46:13 410 0
1 条回答
写回答
取消 提交回答
  • https://developer.aliyun.com/profile/5yerqm5bn5yqg?spm=a2c6h.12873639.0.0.6eae304abcjaIB

    那个值应该是你访问首页(https://malwr.com)时生成的cookie,你需要先访问首页,从responseHeader中获取到这个cookie的值作为你登陆时的参数

    ######在网上查查带cookie处理的爬虫,我做过的
    2020-06-01 11:46:14
    赞同 展开评论 打赏
问答分类:
问答标签:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
From Python Scikit-Learn to Sc 立即下载
Data Pre-Processing in Python: 立即下载
双剑合璧-Python和大数据计算平台的结合 立即下载