文档备案控制台

开发者社区问答正文

scrapy框架中如何实现大文件的下载？

scrapy框架中如何实现大文件的下载？

展开

收起

珍宝珠 2019-11-22 13:57:16 2450 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

珍宝珠

from twisted.web.client import Agent, getPage, ResponseDone, PotentialDataLoss
from twisted.internet import defer, reactor, protocol
from twisted.web._newclient import Response
from io import BytesIO

class _ResponseReader(protocol.Protocol):
    def __init__(self, finished, txresponse, file_name):
        self._finished = finished
        self._txresponse = txresponse
        self._bytes_received = 0
        self.f = open(file_name, mode='wb')
    def dataReceived(self, bodyBytes):
        self._bytes_received += len(bodyBytes)
        # 一点一点的下载
        self.f.write(bodyBytes)
        self.f.flush()
    def connectionLost(self, reason):
        if self._finished.called:
            return
        if reason.check(ResponseDone):
            # 下载完成
            self._finished.callback((self._txresponse, 'success'))
        elif reason.check(PotentialDataLoss):
            # 下载部分
            self._finished.callback((self._txresponse, 'partial'))
        else:
            # 下载异常
            self._finished.errback(reason)
        self.f.close()

2019-11-22 13:57:27

赞同展开评论

问答分类：

Python

问答标签：

Scrapy框架 Scrapy文件 Scrapy下载 Scrapy框架下载

问答地址：

开发者社区 > 开发与运维 > 问答

相关问答

scrapy框架运行的机制是什么？

609

1

0

关于Scrapy 框架运行不出结果的问题，好像没有报错 ?报错

1155

1

0

scrapy 下载百度新闻图片错误?报错

844

1

0

scrapyd&scrapy:如何针对不同spider输出不同日志文件并且能在scrapyd中查看？

931

0

0

从python / scrapy（python framework）在单个csv文件中将数据写入多个

1823

2

0

无法从Scrapy python框架中找到下载的图像

1276

1

0

如何将scrapy框架添加到可移植python中？

840

1

0

在scrapy框架中如何设置代理？

2176

1

0

Scrapy框架中各组件的工作流程？

1672

1

0

爬虫去重有哪些解决方案以及python scrapy爬取超时怎么处理？

234

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

idea qoder cn报错

ECS 带宽跑满导致业务卡顿？CDN 怎么进行分流优化解决高峰期瓶颈？

qoder CN,wiki收费为什么没有提示,以前qoder国际版不是免费的吗,一次跑了几百Cred

阿里云服务器官网在哪？有几种云服务器类型？

阿里云服务器多少钱一年？价格贵不贵？有优惠吗？

相关文章

服务器配置缺陷暴露 Evilginx 双路径 M365 绕过 MFA 钓鱼攻击研究

Claude Code 动态工作流速通指南，多 Agent 干活效率起飞！

实用小工具：端口卫士

GES DISC 的 OMI/Aura 和 MODIS/Aqua Aerosol 地理托管产品 1-Orbit L2 Swath 13x24 km V003 (OMMYDAGEO)

还有其他疑问?