文档备案控制台

开发者社区问答正文

scrapy框架中如何实现大文件的下载？

scrapy框架中如何实现大文件的下载？

展开

收起

珍宝珠 2019-11-22 13:57:16 2414 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

珍宝珠

from twisted.web.client import Agent, getPage, ResponseDone, PotentialDataLoss
from twisted.internet import defer, reactor, protocol
from twisted.web._newclient import Response
from io import BytesIO

class _ResponseReader(protocol.Protocol):
    def __init__(self, finished, txresponse, file_name):
        self._finished = finished
        self._txresponse = txresponse
        self._bytes_received = 0
        self.f = open(file_name, mode='wb')
    def dataReceived(self, bodyBytes):
        self._bytes_received += len(bodyBytes)
        # 一点一点的下载
        self.f.write(bodyBytes)
        self.f.flush()
    def connectionLost(self, reason):
        if self._finished.called:
            return
        if reason.check(ResponseDone):
            # 下载完成
            self._finished.callback((self._txresponse, 'success'))
        elif reason.check(PotentialDataLoss):
            # 下载部分
            self._finished.callback((self._txresponse, 'partial'))
        else:
            # 下载异常
            self._finished.errback(reason)
        self.f.close()

2019-11-22 13:57:27

赞同展开评论

问答分类：

Python

问答标签：

Scrapy框架 Scrapy文件 Scrapy下载 Scrapy框架下载

问答地址：

开发者社区 > 开发与运维 > 问答

相关问答

scrapy框架运行的机制是什么？

584

1

0

关于Scrapy 框架运行不出结果的问题，好像没有报错 ?报错

1125

1

0

scrapy 下载百度新闻图片错误?报错

825

1

0

scrapyd&scrapy:如何针对不同spider输出不同日志文件并且能在scrapyd中查看？

902

0

0

从python / scrapy（python framework）在单个csv文件中将数据写入多个

1799

2

0

无法从Scrapy python框架中找到下载的图像

1245

1

0

如何将scrapy框架添加到可移植python中？

814

1

0

在scrapy框架中如何设置代理？

2151

1

0

Scrapy框架中各组件的工作流程？

1640

1

0

爬虫去重有哪些解决方案以及python scrapy爬取超时怎么处理？

204

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

阿里云大模型Tokens入门：2026年通义千问计费规则、价格与省钱指南

阿里云Tokens收费详解：2026年通义千问计费标准与成本评估

2026年通义千问Tokens全解：定义、计费规则与价格性价比分析

data agent 集成到我的程序

阿里云 Token Plan 是什么？Token Plan和Coding Plan有什么区别？

相关文章

均线选股策略研究：基于 Python 数据分析实现

Java做AI不行？2026年最大的认知误区

Python 3.14安装教程 Windows版：环境变量配置+IDLE启动+自定义路径指南

仿税务钓鱼攻击机理与防御研究 —— 以 SilverFoxAPT 组织印度行动为例

🚀 RESTful API 接口规范详解：构建高效、可扩展的 Web 服务（附 Python 源码）

还有其他疑问?