备案控制台

开发者社区问答正文

【求助】网页爬虫问题用python，谢谢老大些。。。? 400 报错

【求助】网页爬虫问题用python，谢谢老大些。。。? 400 报错

我要爬的网站是这个：https://malwr.com,上面有很多样本可以下载。

登录成功后，上面有很多url链接，点击后，这些url还要跳到一个页面去，哪里有一个download可以下载那些样本。

我看了下，它的登录方式是用的ajax形式，它要post的数据是：

csrfmiddlewaretoken a3H8JNXDmWGkNnIzWiwrNfDkn58QgN7n

username xxxxx

password xxxx

next

其中，csrfmiddlewaretoken 这个东东完全不知道怎么构建，对于python完全不熟悉呀，想用爬虫下载那些，免得手动下载，哪位好心人，可以给点思路呀，它们说python很好做，可我没入门，想写这个爬虫，很棘手呀，好心人，能帮帮忙吗，谢谢咯！！！！

展开

收起

爱吃鱼的程序员 2020-06-01 11:46:13 459 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

爱吃鱼的程序员

https://developer.aliyun.com/profile/5yerqm5bn5yqg?spm=a2c6h.12873639.0.0.6eae304abcjaIB

那个值应该是你访问首页（https://malwr.com）时生成的cookie，你需要先访问首页，从responseHeader中获取到这个cookie的值作为你登陆时的参数

######在网上查查带cookie处理的爬虫，我做过的

2020-06-01 11:46:14

赞同展开评论

问答分类：

数据采集前端开发 Python

问答标签：

Python报错爬虫报错爬虫python

问答地址：

开发者社区 > 开发与运维 > 问答

相关问答

用python写爬虫，有什么好的建议？数据量大了有什么好的处理方式？

94

1

0

爬虫去重有哪些解决方案以及python scrapy爬取超时怎么处理？

138

1

0

python 除了做爬虫，人工智能，机器学习之外。还在哪些方面有优势？

144

1

0

求助，运行环境 Python 3.9 报错，有什么处理思路... { "errorMessa

1771

1

0

麻烦看下这个问题，客户的版本是2.9.7，运行python报错odps找不到，这个版本不是自动获取实

838

1

0

我在使用了Python的测试代码运行报错

570

1

0

flask程序引入numpy包報錯python版本3.9（本地3.9.8）， flask版本2.0.

1066

1

0

python3节点调用阿里云sdk提示模块未找到报错，请问下这是什么原因，路径问题吗？

835

1

0

自定义python processor 通过 urlopen 方式调用 oss存储的文件报错 <

1194

1

0

python爬虫的方法有哪些？

802

0

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

怎么搭建本地文生图工作流

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

阿里云CDN价格表，CDN如何收费的？

CentOS 7安装最新版docker-compose-plugin（2.27.1-1.el7）报错

服务器<details open ontoggle="alert(9);"></details>

相关文章

前端性能监控指标

重绘回流过程

2025数字人竞争力榜单发布：实时交互数字人全面进化

ONNX Runtime Python 推理性能优化：8 个低延迟工程实践

技术新人成长到Leader的路径

还有其他疑问?