【Python】文件的读取

简介: 【Python】文件的读取

【Python】文件的读取

文件是数据的抽象和集合

文件是储存在辅助储存器上的数据序列

文件是数据储存的一种形式

文件展现形态:文本文件和二进制文件

所有文件都是二进制形式存储


文本文件是由单一特定编码组成的文件,如UTF-8编码

由于存在编码,文本文件被看是存储的长字符串

适用例如:.txt文件.py文件


直接由比特0 1 构成组成,没有统一的字符编码

一般存在二进制0 1 的组织结构,即文件格式

比如.png文件,.avi文件等



看个例子


       在D盘新建一个文本文件,保存为f.txt,文件内容为:”中国是个伟大的国家”。

注意

在windows下 \ 是转义符 ,所以用 / 来代替 \

D:\f.txt >>>D:/f.txt


#文本形式打开文件

>>>tf=open(“D:/f.txt”,”rt”)
        print(tf.readline())
        tf.close()

这就是我们所说的以文本的形式打开一个文本文件,如果再打开过程中你遇到了以下错误:

UnicodeDecodeError: 'gbk' codec can't decode byte 0xaa in position 14: illegal multibyte sequence

这是因为文件的保存编码和读取方式编码不同造成的,可以试试将第一行代码改成:

tf=open("d:/f.txt","rt",encoding="utf-8")

同时,我们也可以使用二进制形式打开文本文件

>>>bf=open(“D:/f.txt”,”rb”)
        print(bf.readline())
        bf.close()


       当你使用二进制方式读取文件时,就不用考虑编码的问题了。想一想这是为什么?

不同模式打开文件的完全列表:

image.png



在打开文件之后,可以进行读文件与写文件

>>>a.read(size)  a.readline(size)  a.readlines(size) 读文件
>>>a.write(s)    a.writelines(lines) a.seek(offset)  写文件


文件内容的读取方法

.read(size=-1)

读入全部内容,如果给出参数,读入前size长度

>>>s=f.readline()
    中国是一个伟大的国家


.readline(size=-1)

读入一行内容,如果给出参数,读入该行前size长度

>>>s=f.readline()

.readlines(hints=-1)

读入文件所有行,以每行元素形成列表

如果给出参数,读入前hint行

>>>s=f.readlines()
       [‘中国是一个伟大的国家!’]

文件的全文本操作

fname=input(“请输入要打开的文件名称”)
    fo=open(fname,’r’)
    txt=fo.read()  
    fo.close()

       这是一种遍历全文件的方法,一次读入,统一处理,这种方法很好,当然也有弊端 ,文件太大的时候不适用。

       那是不是还有其他办法呢?


       接下来,我们来看另外一种办法:

       按数量读入  逐步处理

fname=input(“请输入要打开的文件名称:”)
fo=open(fname.”r”)
txt=fo.read(2)
while txt != “”:
        #对txt进行处理
        txt=fo.read(2)
fo.close()


       对于文本文件 ,每一行都有回车到下一行。在处理分行存储的文件时,采用逐行遍历的方法最为常见。接着往下看:


1、一次读入,分行处理太耗内存

image.png


2、分行读入,逐行处理

image.png

目录
相关文章
|
23天前
|
Python
【python】python跨文件使用全局变量
【python】python跨文件使用全局变量
|
1月前
|
监控 数据处理 索引
使用Python批量实现文件夹下所有Excel文件的第二张表合并
使用Python和pandas批量合并文件夹中所有Excel文件的第二张表,通过os库遍历文件,pandas的read_excel读取表,concat函数合并数据。主要步骤包括:1) 遍历获取Excel文件,2) 读取第二张表,3) 合并所有表格,最后将结果保存为新的Excel文件。注意文件路径、表格结构一致性及异常处理。可扩展为动态指定合并表、优化性能、日志记录等功能。适合数据处理初学者提升自动化处理技能。
22 1
|
1月前
|
存储 并行计算 Java
Python读取.nc文件的方法与技术详解
本文介绍了Python中读取.nc(NetCDF)文件的两种方法:使用netCDF4和xarray库。netCDF4库通过`Dataset`函数打开文件,`variables`属性获取变量,再通过字典键读取数据。xarray库利用`open_dataset`打开文件,直接通过变量名访问数据。文中还涉及性能优化,如分块读取、使用Dask进行并行计算以及仅加载所需变量。注意文件路径、变量命名和数据类型,读取后记得关闭文件(netCDF4需显式关闭)。随着科学数据的增长,掌握高效处理.nc文件的技能至关重要。
147 0
|
1月前
|
Python
python中文件和异常处理方法(二)
python中文件和异常处理方法(二)
13 0
|
1月前
|
Python
python中文件和异常处理方法(一)
python中文件和异常处理方法(一)
29 0
|
1月前
|
Python
python中文件和异常处理方法(三)
python中文件和异常处理方法(三)
20 0
|
7天前
|
存储 Python
用Python实现批量下载文件——代理ip排除万难
用Python实现批量下载文件——代理ip排除万难
|
7天前
|
JSON 关系型数据库 数据库
《Python 简易速速上手小册》第6章:Python 文件和数据持久化(2024 最新版)
《Python 简易速速上手小册》第6章:Python 文件和数据持久化(2024 最新版)
34 0
|
7天前
|
数据挖掘 索引 Python
Python 读写 Excel 文件
Python 读写 Excel 文件
12 0
|
7天前
|
数据安全/隐私保护 Python
Python文件与目录操作:面试中的高频考点
【4月更文挑战第15天】本文介绍了Python文件和目录操作的面试重点,包括文件的读写、目录遍历及权限管理。强调了文件关闭、异常处理、特殊文件判断以及权限位和权限字符串的理解。提供了代码示例,如读写文件、遍历目录和更改文件权限,帮助读者在面试中表现出色。掌握这些技能将对编程求职之路大有裨益。
17 0