大文件的读取方式 | Python从入门到精通：高阶篇之四十七

2020-03-28 2012

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 直接调用read()时它会将文本文件的所有内容全部都读取出来；如果要读取的文件较大的话，会一次性将文件的内容加载到内存中，容易导致内存泄漏，所以对于较大的文件，不要直接调用read()。

查看上一节：文件的简单读取

读取大文件

上节课我们讲了可以使用read来读取文件，而且使用open来打开文件的话是要考虑文件的编码格式的，另外关于二进制文件如何打开后续再说。
read()使用的几点注意：
1、如果直接调用read()它会将文本文件的所有内容全部都读取出来；
2、如果要读取的文件较大的话，会一次性将文件的内容加载到内存中，容易导致内存泄漏；所以对于较大的文件，不要直接调用read()。
那该如何读取大文件呢？首先使用help查看一下read()的信息：

help(file_obj.read)

执行结果为：

可以看到有一个size的数据，并且大小为-1。
注意：
1、 read()可以接收一个size作为参数，该参数用来指定要读取的字符的数量；
2、默认值为-1，它会读取文件中的所有字符；
3、可以为size指定一个值，这样read()会读取指定数量的字符；
4、每一次读取都是从上次读取到位置开始读取的
5、如果字符的数量小于size，则会读取剩余所有的
6、如果已经读取到了文件的最后了，则会返回''空串
代码如下：

file_name = 'demo2.txt'

try:
    with open(file_name,encoding='utf-8') as file_obj:

        # content = file_obj.read(-1)
        content = file_obj.read(6)#指定读取6个字符
        content = file_obj.read(6)#从上次读取到的位置开始
        print(content)
        print(len(content))
except FileNotFoundError :
    print(f'{file_name} 这个文件不存在！')

执行结果为：

如果再添加2行 content = file_obj.read(6))：
执行结果为：

再添加一行就不再有字符串可以读取了，即返回空串：