Python:文件操作详细教程

简介: Python:文件操作详细教程

文件操作示例分析:

文件操作一般要经历三个步骤:

  1. 打开文件
  2. 操作文件
  3. 关闭文件

读取操作示例:

>>>f = open('test.txt', 'r')          # 打开文件test.txt, r表示只读,文件不存在则报错
>>>f.read()                           # 文件打开后,read()方法将文件内容读到内存中
'123432'                              # 获取的内容是一个字符串
>>>f.close()                          # 文件使用完必须关闭,打开文件占用资源

打开文件:文件句柄 = file('文件路径',‘模式’)

备注:Python中打开文件有两种方式,即open()和file(),本质上前者会调用后者进行文件操作,推荐使用open

上诉,方式中,每次打开一个文件操作完成后,都要手动关闭文件,操作繁琐,易忘。推荐一种更加简便的操作方式:with语句, 这种语句帮助我们自动完成f.close() 这一步操作。

with open('test.txt', 'r') as f:
    file = f.read()
    print(type(file))
    pirint(file)

# 输出结果
<class'str'>  # 取出的内容还是字符串
123432       # 虽然没有看到引号,但还是字符串
----------------------------------------------------------------------
# with 语句的多文件同时处理
# Python2.7版本之后,with 支持同事打开多个文件
with open('db1','r') as f1, open('db2', 'r') as f2:
    pass

-----------------------------------------------------------------------

# 一个文件读取一行处理一行然后写入另一个文件一行
with open('db1', 'r', encoding="utf-8") as f1, open('db2', 'w', encoding="utf-8") as f2:
    for line in f1:
        new_str = line.replace('abc', "st")
        f2.write(new_str)

写入文件示例:

with open('test.txt', 'a+') as f:
    f.write('hello world')

备注:所有的文件操作,如果文件没有写绝对路径,默认路径为程序所在路径,文件操作要注意操作文件的存在性。

文件操作权限:

r   # 以只读的方式打开文件,文件的指针放在文件的开头,默认方式
r+  # 以读写模式打开,和追加效果一样,但是如果文件不存在,不会像a一样创建文件,而是报错
rb  # 以二进制格式打开一个文件用于只读,文件指针将会放在文件的开头,这是默认模式
rb+ # 以二进制格式打开一个文件用于读写,文件指针放在文件的开头
w   # 替换重写(覆盖写入)
w+  # 以读写模式打开文件,如果该文件已经存在则将其内容覆盖,文件不存在则创建文件
wb  # 以二进制格式打开一个文件只用于写入,如果该文件已经存在则将其内容覆盖,文件不存在则创建文件
wb+ # 以二进制格式打开一个文件用于读写, 如果该文件已经存在则将其内容覆盖,文件不存在则创建文件
a   # 在原文件的基础上,追加写入,文件指针放在文件结尾,如果文件不存在,则创建新文件进行写入
a+  # 打开一个文件用于读写,如果文件已经存在,文件指针放在文件结尾。文件打开时是追加模式,如果文件不存在则创建文件用于读写
ab  # 以二进制格式打开一个文件,如果文件存在,文件指针放在文件结尾,文件不存在则创建新文件并进行写入
ab+ # 以二进制格式打开一个文件用于追加,如果文件存在,文件指针放在文件结尾,文件不存在则创建新文件用于读写
b   # 二进制文件,主要用于跨平台,来解决windows和linux的回车换行区别,按照字节
x   # python3中添加,如果文件存在则报错,不存在则创建并写入内容

文件其他方法:

f.mode      # 显示文件打开格式
f.flush()   # 把缓冲区中的数据刷到硬盘,当你往文件里写数据时,python会先把你写的内容写到缓冲区,等缓冲区满了再统一自动写入硬盘,因此减少了对硬盘的操作次数,毕竟硬盘的速度比内存慢得多
f.read()      # 把文件一次性读入内存
f.read(szie)  # 一次读取指定大小的文件
f.readline()  # 读取一行文件
f.readlines() # 把文件都读入内存,并且每行转成列表中的一个元素
f.tell()      # 显示程序光标所在该文件中的当前的位置,位置是以字节来算的
f.seek()      # 跳到指定位置,f.seek(0) 是返回文件开始,位置是以字节来算的
f.truncate()   # f.truncate(10) 从文件开头截取10个字符,超出的都删除
f.writelines() # 参数需为一个列表,将一个列表中的每一个元素都写入文件
f.xreadlines() # 以迭代的形式循环文件,在处理大文件时效率极高,只记录文件开头和结尾,每循环一次,只读一行,因此不需要将整个文件都一次性加载到内存,而如果用readlines(),则需要将整个文件都加载到内存,处理大文件不合适。
f.next()       # 获取下一行数据,不存在,则报错

文件对象的属性


file.closed       # 返回True如果文件已经关闭,否则返回False
file.mode        # 返回被打开文件的访问模式
file.name        #  返回文件的名称
file.softspace  # 如果用print输出后,必须跟一个空格符,则返回False ,否则返回True

文件读取选择:

  • 文件很小,read() 最方便
  • 不确定文件大小,反复调用read(size) 安全
  • 如果是配置文件,调用readlines() 最方便

操作系统中文件操作

import os    # python中的文件操作需要导入os模块
os.rename( current_file_name, new_file_name)   # 文件重命名
os.remove( file_name )   # 删除文件
os.mkdir( "test")            # 创建一个目录test
os.chdir( "newdir" )        # 切换目录到newdir
os.getcwd()                   # 获取当前目录的路径
os.rmdir( "dirname" )     # 删除目录,在删除目录前,它的所有内容应该先被清除
相关文章
|
1月前
|
存储 Python
SciPy 教程 之 SciPy 稀疏矩阵 4
SciPy 教程之 SciPy 稀疏矩阵 4:介绍稀疏矩阵的概念、类型及其在科学计算中的应用。SciPy 的 `scipy.sparse` 模块提供了处理稀疏矩阵的工具,重点讲解了 CSC 和 CSR 两种格式,并通过示例演示了如何创建和操作 CSR 矩阵。
45 3
|
22天前
|
Python
SciPy 教程 之 Scipy 显著性检验 9
SciPy 教程之 Scipy 显著性检验第9部分,介绍了显著性检验的基本概念、作用及原理,通过样本信息判断假设是否成立。着重讲解了使用scipy.stats模块进行显著性检验的方法,包括正态性检验中的偏度和峰度计算,以及如何利用normaltest()函数评估数据是否符合正态分布。示例代码展示了如何计算一组随机数的偏度和峰度。
22 1
|
22天前
|
BI Python
SciPy 教程 之 Scipy 显著性检验 8
本教程介绍SciPy中显著性检验的应用,包括如何利用scipy.stats模块进行显著性检验,以判断样本与总体假设间的差异是否显著。通过示例代码展示了如何使用describe()函数获取数组的统计描述信息,如观测次数、最小最大值、均值、方差等。
25 1
|
23天前
|
数据采集 数据可视化 数据挖掘
深入浅出:使用Python进行数据分析的基础教程
【10月更文挑战第41天】本文旨在为初学者提供一个关于如何使用Python语言进行数据分析的入门指南。我们将通过实际案例,了解数据处理的基本步骤,包括数据的导入、清洗、处理、分析和可视化。文章将用浅显易懂的语言,带领读者一步步掌握数据分析师的基本功,并在文末附上完整的代码示例供参考和实践。
|
23天前
|
Python
SciPy 教程 之 Scipy 显著性检验 6
显著性检验是统计学中用于判断样本与总体假设间是否存在显著差异的方法。SciPy的scipy.stats模块提供了执行显著性检验的工具,如T检验,用于比较两组数据的均值是否来自同一分布。通过ttest_ind()函数,可以获取两样本的t统计量和p值,进而判断差异是否显著。示例代码展示了如何使用该函数进行T检验并输出结果。
23 1
|
25天前
|
Python
SciPy 教程 之 Scipy 显著性检验 3
本教程介绍Scipy显著性检验,包括其基本概念、原理及应用。显著性检验用于判断样本与总体假设间的差异是否显著,是统计学中的重要工具。Scipy通过`scipy.stats`模块提供了相关功能,支持双边检验等方法。
26 1
|
27天前
|
机器学习/深度学习 Python
SciPy 教程 之 SciPy 插值 2
SciPy插值教程:介绍插值概念及其在数值分析中的应用,特别是在处理数据缺失时的插补和平滑数据集。SciPy的`scipy.interpolate`模块提供了强大的插值功能,如一维插值和样条插值。通过`UnivariateSpline()`函数,可以轻松实现单变量插值,示例代码展示了如何对非线性点进行插值计算。
25 3
|
1月前
|
机器学习/深度学习 数据处理 Python
SciPy 教程 之 SciPy 空间数据 4
本教程介绍了SciPy的空间数据处理功能,主要通过scipy.spatial模块实现。内容涵盖空间数据的基本概念、距离矩阵的定义及其在生物信息学中的应用,以及如何计算欧几里得距离。示例代码展示了如何使用SciPy计算两点间的欧几里得距离。
33 5
|
29天前
|
机器学习/深度学习 Python
SciPy 教程 之 SciPy 空间数据 6
本教程介绍了SciPy处理空间数据的方法,包括使用scipy.spatial模块进行点位置判断、最近点计算等内容。还详细讲解了距离矩阵的概念及其应用,如在生物信息学中表示蛋白质结构等。最后,通过实例演示了如何计算两点间的余弦距离。
30 3
|
28天前
|
机器学习/深度学习 数据处理 Python
SciPy 教程 之 SciPy 空间数据 7
本教程介绍了SciPy的空间数据处理功能,涵盖如何使用`scipy.spatial`模块进行点的位置判断、最近点计算等操作。还详细解释了距离矩阵的概念及其在生物信息学中的应用,以及汉明距离的定义和计算方法。示例代码展示了如何计算两个点之间的汉明距离。
32 1