python文件操作及seek偏移详解

简介:

一、python文件操作中的编码

       本次测试是基于python 2.7.12   OS:Ubuntu16.04  pycharm环境,以及win7下2.7.12;

首先说下汉字在文件中占用的字节数,这个先看以下实验(win7)下 因为linux下不支持gbk,本文不讲utf-8 ,gbk编码具体知识,有兴趣可以访问http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html或自行搜索相当资料。本次实验只讲解python在使用utf-8和gbk编码时,对汉字占用的字节有所不同。

先看下实验截图:

wKioL1lXXvzQh-t4AACbOKqpXTw923.png-wh_50


右上解的代码如下:

1
2
3
4
5
6
7
8
9
10
11
12
#-*- coding: utf-8 -*-
with  open ( "test2.txt" , "w" ) as f:
     f.write( "董hellow world!" )
     f.write( "Python is a good language!\n" )
     f.write( "Python 是世界上最好的语言!" )
with  open ( "test2.txt" , "r" ) as f:
     print ( len (f.read()))
     f.seek( 0 )
     print  f.read( 2 )
     f.seek( 0 )
     print  f.read( 3 )
     f.tell()

保存运行(F5) 运行结果为图左上角 出现长度78  和汉字"董"的乱码 再次从头读3个字节 可以正确显示“董”


右下解的代码如下:

1
2
3
4
5
6
7
8
9
10
#-*- coding: gbk -*-
with  open ( "test3.txt" , "w" ) as f:
     f.write( "董hellow world!" )
     f.write( "Python is a good language!\n" )
     f.write( "Python 是世界上最好的语言!" )
with  open ( "test3.txt" , "r" ) as f:
     print ( len (f.read()))
     f.seek( 0 )
     print  f.read( 2 )
     f.tell()


保存运行(F5)运行结果为图左下角 出现长度为68  能正确显示“董”


test2.txt 和test3.txt中的内容均一样,只是在不同的编码下存入文件中!

从实验可以看出汉字在utf8编码下占3个字节,gbk下占2个字节,而英文不管在那个编码下都只占1个字节!



二、python文件操作

搞清楚以上问题我们可以通过操作文件来读取内容,以防止是乱码。

1、python文件操作主要通过file(3版本去掉了), open(2,3版本均有)函数来实现

open函数中最主要的几个模式说明及对比:

模式 打开方式 文件存在 文件不存在
r 只读 打开文件 出错
w 只写 清除原有文件内容 创建并打开新文件
a 只写(追加) 保留文件内容,将新数据添加到文件末尾 创建并打开新文件
r+ 读写 从文件开始处读或重写文件内容 出错
w+ 读写 清除文件内容 创建并打开新文件
a+ 读写 保留文件内容,将新数据添加到文件末尾 创建并打开新文件


注:如是是对二进制文件操作即在以上模式中加一个b 如读二制文件rb


2、文件操作方法实验

f.write()    #字符串写入文件

f.writelines   #将一串字符串写入文件。 该序列可以是生成字符串的任何可迭代对象,通常是字符串列表

f.read([size])   #默认读出文件中所有内容,可以指定size(字节)

f.readline([size])        #默认每次读取一行,字符串中保留一个尾随的换行字符。

f.readlines([size])      #默认将文件内容讲到列表中保存

f.flush()        #将缓冲中的内容写入磁盘

f.tell()       #显示当前文件的指针所在位置

f.close()    #关闭打开的文件

f.seek()       #对文件进行指针偏移操作,有三个模式,

            seek(0,0) 默认移动到文件开头或简写成seek(0)

            seek(x,1) 表示从当前指针位置向后移x(正数)个字节,如果x是负数,则是当前位置向前移动x个字节

            seek(x,2) 表示从文件末尾向前后移x(正数)个字节,如果x负数,则是从末尾向前移动x个字节


3、对文件seek详细说明

实验代码如下:

先创建一个文件file2.txt

1
2
3
4
5
# -*- coding: utf-8 -*-
=  open ( "file2.txt" , 'w+' )
f.write( "I love python\n" )
f.write( "python 是世界上最美丽的语言!\n" )
f.write( "python 世界上最美丽的语言?" )

file2.txt内容如下:

I love python
python 是世界上最美丽的语言!
Python 世界上最美丽的语言


对file2.txt进行操作

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
=  open ( "file2.txt" , 'r' )
print ( len (f.read()))      #文件总长度 89
print (f.tell())           #读完文件,文件指针位置89
f.seek( 0 , 0 )               #偏移回文件头
print (f.readline())       #打印出文件中一行(第一行)
print  f.tell()            #显示文件指针现在的位置
f.seek( 2 , 1 )               #从当前文件指针(向后)偏移2个字节
print (f.readline())       #再打印一行(应该少2个字节)
print (f.tell())           #显示 现在 的指针位置
f.seek( - 7 , 1 )              #从当前位置向前偏移2个字节
print (f.readline())       #打印下一行
print (f.tell())           #显示 现在 的指针位置
f.seek( - 9 , 2 )              #从尾部向前偏移9个字符
print (f.tell())           #显示 现在 的指针位置
print (f.readline())       #打印出内容
f.seek( 0 )   #==>默认是0 等等seek(0,0)
f.seek( 80 )       #等同上面的seek(-9,2) 从尾部取
print (f.readline())

结果如图:

wKiom1lXWwaR19haAAQ7CNh4G2U611.png-wh_50


本文均为在学习过程中的实验结果,可能不同版本不同平台略有误差,如有不当之处,欢迎指正交流!










本文转自 dyc2005 51CTO博客,原文链接:http://blog.51cto.com/dyc2005/1943682,如需转载请自行联系原作者
目录
相关文章
|
8月前
|
安全 Python
Python语言中常用的文件操作方法探讨
通过上述方法的结合使用,我们可以构筑出强大并且可靠的文件操作逻辑,切实解决日常编程中遇到的文件处理问题。
311 72
|
8月前
|
移动开发 安全 Linux
Python文件操作的"保险箱":with语句深度实战指南
本文深入解析Python中`with`语句的原理与高级应用,通过“保险箱”类比,形象展示资源管理机制。从上下文管理协议到实战场景,涵盖文件、数据库、网络等多种资源的高效安全处理方式,助你写出更优雅、可靠的代码。
208 1
|
9月前
|
缓存 数据库连接 数据库
Python文件操作的“保险箱”:with语句深度实战指南
本文深入探讨Python中with语句在文件操作中的应用及其优势。首先介绍其底层原理,基于上下文管理协议自动管理资源的获取与释放,避免手动关闭文件导致的资源泄漏问题。接着通过基础文件读写、异常处理进阶和复合资源管理等实战场景解析with语句的便捷性与安全性。同时,阐述如何自定义上下文管理器以满足特定需求,并分析其性能考量及优化策略。最后总结实战经验,强调优先使用内置管理器、明确异常处理以及保持代码可读性的重要性,助力开发者高效编写健壮的程序。
224 1
|
9月前
|
自然语言处理 安全 JavaScript
Python文件操作的“保险箱”:with语句深度实战指南
Python中的`with`语句是文件操作和资源管理的强大工具,如同一个智能保险箱,自动处理打开和关闭操作,避免手动管理可能引发的错误。它通过上下文管理协议(`__enter__`和`__exit__`方法)确保资源在使用后正确释放。无论是逐块读取大文件、同时读写文件,还是处理特殊编码文件,`with`语句都能简化代码并提高安全性。此外,自定义上下文管理器可扩展到数据库连接等场景,而常见错误如重复关闭文件或忽略异常也需注意。结合生成器表达式批量处理文件时,`with`语句仍能保持高效和安全。总之,`with`语句是资源管理的瑞士军刀,让复杂操作变得简单可靠。
271 1
|
9月前
|
数据采集 运维 BI
Python 文件操作进阶|使用 shutil 实现高效文件复制
在开发和运维中,处理大量文件是常见需求,如备份配置、归档日志或构建部署包。手动复制粘贴已无法满足高效需求!Python 的 `shutil` 模块提供了强大的文件操作功能,支持单文件复制、目录树迁移及自动化任务构建。本文详解 `shutil.copy()` 基础用法与进阶技巧,如批量复制、自动路径检测、时间戳命名备份等,助你实现高效自动化。结合实战案例(如自动备份系统),让你的代码更专业!学习后,欢迎交流心得,一起精进 Python 技能。关注我,获取更多编程技巧与源码分享!
|
监控 Java 数据处理
文件操作不再难!Python系统编程实战,带你轻松驾驭文件系统与I/O
【7月更文挑战第31天】在 Python 系统编程中, 文件操作与 I/O 管理至关重要。
209 2
|
存储 Python
Python文件操作(1)
【10月更文挑战第17天】
280 60
Python文件操作(1)
|
数据采集 存储 Python
Python文件操作2
【10月更文挑战第18天】
136 2
Python文件操作2
|
IDE 测试技术 开发工具
Python接口自动化测试框架(基础篇)-- 不只是txt的文件操作
本文介绍了Python中的文件操作方法,包括使用open()打开文件、close()关闭文件、read()读取内容、readline()读取单行、readlines()读取多行、write()写入内容以及writelines()写入多行的方法。同时,探讨了文件操作模式和编码问题,并扩展了上下文管理器with...as的使用,以及对图片和音频文件操作的思考和练习。
195 1
Python接口自动化测试框架(基础篇)-- 不只是txt的文件操作
|
存储 Python
Python文件操作
Python文件操作

推荐镜像

更多