备案控制台

开发者社区问答正文

如何多次申请

我的问题是如何使用Scrapy Formrequest来进行顺序表单提交，然后获取数据现在我用刮刮一个网站，你必须登录才能搜索到想要的结果，然后我想刮刮这些结果。网站流程如下: 登录页面->搜索引擎页面->结果页面下面是一些示例代码我目前能通过登录页面的内部搜索引擎页面但我难以创造下一个请求表单,我需要提交我想搜索和获取价值的结果页面数据我想刮。这是我的蜘蛛:

import scrapy
from ..items import QuotetutorialItem
from scrapy import FormRequest

class QuoteSpider(scrapy.Spider):
    # name of our Spider
    name = 'home'

    start_urls = ['https://example.com/Login']
    def parse(self, response):

        return FormRequest.from_response(response, formdata={
            'username': 'user id',
            'password': 'foo_bar'
        }, callback=self.start_search)

    def start_search(self, response):
        search = 'value'

        return FormRequest.from_response(response, formdata={
            'searchInput': search
        }, callback=self.start_scrapping)

    def start_scrapping(self, response):
        title = response.css('title::text').extract()

        yield {'name of title: ', title}

问题来源StackOverflow 地址：/questions/59382906/scrapy-how-to-formrequest-multiple-times

展开

收起

kun坤 2019-12-27 16:57:52 495 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

问问小秘

&

2019-12-27 17:25:21

赞同展开评论

问答分类：

搜索推荐 Python

问答地址：

开发者社区 > 人工智能 > 问答

相关问答

请问下我访问接口不通什么原因 Provisional headers are shown

2873

0

0

购买阿里国外的云服务器是否可以访问谷歌？

82218

47

0

通过www和不带www的网址输入最终都指向www.我的域名.com，求指教

131154

28

0

this xml file does not appear to have any style in

50645

10

0

sql server的用户名和密码怎么查啊？

36672

21

0

OSS的endpoint如何查看

37006

6

0

计算机网络的频带传输是什么意思？

2011

1

0

手机弹出支付风险问题

6827

2

0

域名在腾讯云备案成功，解析到阿里云服务器，提示仍需备案？

60259

30

0

配置了安全组规则，端口还是无法访问

32894

25

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

阿里云双十一优惠活动开始了？2025年的是这个吗？

钉钉:因安全管控限制,16位参与人无法直接添加到日程

阿里云PAI是什么？怎么用？

如何训练属于自己的AI大模型呢？有没有大佬有相关文档参考学习下

阿里云2核2G3M适合搭建个人博客或小型项目吗？

相关文章

蚂蚁百宝箱联手深铁打造全国首个地铁 AI 智能体「深铁宝」：你的全能城市向导来啦~

数字化转型不是买系统，而是用数据“开脑洞”

精准流量高效转化：1688店铺提升支付转化率的四大核心策略！

Python因果分析选哪个？六个贝叶斯推断库实测对比（含代码示例）

Dify vs Coze：谁是最终的AI工作流解决方案？

还有其他疑问?