备案控制台

开发者社区问答正文

scrapy框架中如何实现大文件的下载？

scrapy框架中如何实现大文件的下载？

展开

收起

珍宝珠 2019-11-22 13:57:16 2353 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

珍宝珠

from twisted.web.client import Agent, getPage, ResponseDone, PotentialDataLoss
from twisted.internet import defer, reactor, protocol
from twisted.web._newclient import Response
from io import BytesIO

class _ResponseReader(protocol.Protocol):
    def __init__(self, finished, txresponse, file_name):
        self._finished = finished
        self._txresponse = txresponse
        self._bytes_received = 0
        self.f = open(file_name, mode='wb')
    def dataReceived(self, bodyBytes):
        self._bytes_received += len(bodyBytes)
        # 一点一点的下载
        self.f.write(bodyBytes)
        self.f.flush()
    def connectionLost(self, reason):
        if self._finished.called:
            return
        if reason.check(ResponseDone):
            # 下载完成
            self._finished.callback((self._txresponse, 'success'))
        elif reason.check(PotentialDataLoss):
            # 下载部分
            self._finished.callback((self._txresponse, 'partial'))
        else:
            # 下载异常
            self._finished.errback(reason)
        self.f.close()

2019-11-22 13:57:27

赞同展开评论

问答分类：

Python

问答标签：

Scrapy框架 Scrapy文件 Scrapy下载 Scrapy框架下载

问答地址：

开发者社区 > 开发与运维 > 问答

相关问答

scrapy框架运行的机制是什么？

547

1

0

关于Scrapy 框架运行不出结果的问题，好像没有报错 ?报错

1087

1

0

scrapy 下载百度新闻图片错误?报错

791

1

0

scrapyd&scrapy:如何针对不同spider输出不同日志文件并且能在scrapyd中查看？

852

0

0

从python / scrapy（python framework）在单个csv文件中将数据写入多个

1757

2

0

无法从Scrapy python框架中找到下载的图像

1193

1

0

如何将scrapy框架添加到可移植python中？

778

1

0

在scrapy框架中如何设置代理？

2107

1

0

Scrapy框架中各组件的工作流程？

1589

1

0

爬虫去重有哪些解决方案以及python scrapy爬取超时怎么处理？

138

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

通义灵码启动异常，可点击按钮进行一键修复，如仍无法解决，请参考[问题排查指南](https://he

关于idea lingma欺骗的对话。请开发者尽快修复

怎么搭建本地文生图工作流

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

阿里云CDN价格表，CDN如何收费的？

相关文章

在 OpenAI 打造流处理平台：超大规模实时计算的实践与思考

掌握CentOS进程信号发送与处理（Linux系统下kill命令与信号机制详解）

减速机行业场景化技术方案与数据化选型指南

减速机行业场景化技术方案与数据化选型指南

还有其他疑问?