python文件操作及seek偏移详解

简介:

一、python文件操作中的编码

       本次测试是基于python 2.7.12   OS:Ubuntu16.04  pycharm环境,以及win7下2.7.12;

首先说下汉字在文件中占用的字节数,这个先看以下实验(win7)下 因为linux下不支持gbk,本文不讲utf-8 ,gbk编码具体知识,有兴趣可以访问http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html或自行搜索相当资料。本次实验只讲解python在使用utf-8和gbk编码时,对汉字占用的字节有所不同。

先看下实验截图:

wKioL1lXXvzQh-t4AACbOKqpXTw923.png-wh_50


右上解的代码如下:

1
2
3
4
5
6
7
8
9
10
11
12
#-*- coding: utf-8 -*-
with  open ( "test2.txt" , "w" ) as f:
     f.write( "董hellow world!" )
     f.write( "Python is a good language!\n" )
     f.write( "Python 是世界上最好的语言!" )
with  open ( "test2.txt" , "r" ) as f:
     print ( len (f.read()))
     f.seek( 0 )
     print  f.read( 2 )
     f.seek( 0 )
     print  f.read( 3 )
     f.tell()

保存运行(F5) 运行结果为图左上角 出现长度78  和汉字"董"的乱码 再次从头读3个字节 可以正确显示“董”


右下解的代码如下:

1
2
3
4
5
6
7
8
9
10
#-*- coding: gbk -*-
with  open ( "test3.txt" , "w" ) as f:
     f.write( "董hellow world!" )
     f.write( "Python is a good language!\n" )
     f.write( "Python 是世界上最好的语言!" )
with  open ( "test3.txt" , "r" ) as f:
     print ( len (f.read()))
     f.seek( 0 )
     print  f.read( 2 )
     f.tell()


保存运行(F5)运行结果为图左下角 出现长度为68  能正确显示“董”


test2.txt 和test3.txt中的内容均一样,只是在不同的编码下存入文件中!

从实验可以看出汉字在utf8编码下占3个字节,gbk下占2个字节,而英文不管在那个编码下都只占1个字节!



二、python文件操作

搞清楚以上问题我们可以通过操作文件来读取内容,以防止是乱码。

1、python文件操作主要通过file(3版本去掉了), open(2,3版本均有)函数来实现

open函数中最主要的几个模式说明及对比:

模式 打开方式 文件存在 文件不存在
r 只读 打开文件 出错
w 只写 清除原有文件内容 创建并打开新文件
a 只写(追加) 保留文件内容,将新数据添加到文件末尾 创建并打开新文件
r+ 读写 从文件开始处读或重写文件内容 出错
w+ 读写 清除文件内容 创建并打开新文件
a+ 读写 保留文件内容,将新数据添加到文件末尾 创建并打开新文件


注:如是是对二进制文件操作即在以上模式中加一个b 如读二制文件rb


2、文件操作方法实验

f.write()    #字符串写入文件

f.writelines   #将一串字符串写入文件。 该序列可以是生成字符串的任何可迭代对象,通常是字符串列表

f.read([size])   #默认读出文件中所有内容,可以指定size(字节)

f.readline([size])        #默认每次读取一行,字符串中保留一个尾随的换行字符。

f.readlines([size])      #默认将文件内容讲到列表中保存

f.flush()        #将缓冲中的内容写入磁盘

f.tell()       #显示当前文件的指针所在位置

f.close()    #关闭打开的文件

f.seek()       #对文件进行指针偏移操作,有三个模式,

            seek(0,0) 默认移动到文件开头或简写成seek(0)

            seek(x,1) 表示从当前指针位置向后移x(正数)个字节,如果x是负数,则是当前位置向前移动x个字节

            seek(x,2) 表示从文件末尾向前后移x(正数)个字节,如果x负数,则是从末尾向前移动x个字节


3、对文件seek详细说明

实验代码如下:

先创建一个文件file2.txt

1
2
3
4
5
# -*- coding: utf-8 -*-
=  open ( "file2.txt" , 'w+' )
f.write( "I love python\n" )
f.write( "python 是世界上最美丽的语言!\n" )
f.write( "python 世界上最美丽的语言?" )

file2.txt内容如下:

I love python
python 是世界上最美丽的语言!
Python 世界上最美丽的语言


对file2.txt进行操作

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
=  open ( "file2.txt" , 'r' )
print ( len (f.read()))      #文件总长度 89
print (f.tell())           #读完文件,文件指针位置89
f.seek( 0 , 0 )               #偏移回文件头
print (f.readline())       #打印出文件中一行(第一行)
print  f.tell()            #显示文件指针现在的位置
f.seek( 2 , 1 )               #从当前文件指针(向后)偏移2个字节
print (f.readline())       #再打印一行(应该少2个字节)
print (f.tell())           #显示 现在 的指针位置
f.seek( - 7 , 1 )              #从当前位置向前偏移2个字节
print (f.readline())       #打印下一行
print (f.tell())           #显示 现在 的指针位置
f.seek( - 9 , 2 )              #从尾部向前偏移9个字符
print (f.tell())           #显示 现在 的指针位置
print (f.readline())       #打印出内容
f.seek( 0 )   #==>默认是0 等等seek(0,0)
f.seek( 80 )       #等同上面的seek(-9,2) 从尾部取
print (f.readline())

结果如图:

wKiom1lXWwaR19haAAQ7CNh4G2U611.png-wh_50


本文均为在学习过程中的实验结果,可能不同版本不同平台略有误差,如有不当之处,欢迎指正交流!










本文转自 dyc2005 51CTO博客,原文链接:http://blog.51cto.com/dyc2005/1943682,如需转载请自行联系原作者
目录
相关文章
|
4月前
|
存储 Python
Python文件操作(1)
【10月更文挑战第17天】
Python文件操作(1)
|
7月前
|
监控 Java 数据处理
文件操作不再难!Python系统编程实战,带你轻松驾驭文件系统与I/O
【7月更文挑战第31天】在 Python 系统编程中, 文件操作与 I/O 管理至关重要。
78 2
|
4月前
|
数据采集 存储 Python
Python文件操作2
【10月更文挑战第18天】
Python文件操作2
|
8月前
|
开发者 Python
Python基础第七篇(Python的文件操作)
Python基础第七篇(Python的文件操作)
|
5月前
|
存储 Python
Python文件操作
Python文件操作
|
5月前
|
存储 安全 Python
30天拿下Python之文件操作
30天拿下Python之文件操作
39 1
|
6月前
|
IDE 测试技术 开发工具
Python接口自动化测试框架(基础篇)-- 不只是txt的文件操作
本文介绍了Python中的文件操作方法,包括使用open()打开文件、close()关闭文件、read()读取内容、readline()读取单行、readlines()读取多行、write()写入内容以及writelines()写入多行的方法。同时,探讨了文件操作模式和编码问题,并扩展了上下文管理器with...as的使用,以及对图片和音频文件操作的思考和练习。
50 1
Python接口自动化测试框架(基础篇)-- 不只是txt的文件操作
|
5月前
|
监控 安全 Java
文件操作不再难!Python系统编程实战,带你轻松驾驭文件系统与I/O
【9月更文挑战第13天】在Python系统编程中,文件操作与I/O管理至关重要。本文通过五个实战案例分享最佳实践:高效遍历文件系统、优雅处理文件读写、利用缓冲机制优化性能、并行处理文件加速任务以及异常处理确保程序稳健。使用pathlib、上下文管理器及concurrent.futures等工具,助你轻松掌握Python文件系统与I/O操作,提升编程效率和项目质量。 示例代码展示了如何使用pathlib遍历目录、with语句安全读写文件、控制缓冲区大小、并行处理多个文件以及捕获异常保证程序稳定运行。通过这些技巧,你将能够在实际项目中更加高效地管理和操作文件。
56 6
|
4月前
|
Java 程序员 Python
【Python】文件操作
【Python】文件操作
33 0
|
6月前
|
安全 Python
python文件操作详解
整个文件操作过程中,我们应始终保持代码的健壮性和清晰性,确保在出现错误时资源能够被正确释放。
76 1

热门文章

最新文章