python基础---文件处理

简介:

文件处理



f=open(‘文件’r’)         打开一个文件

f.close()                关闭文件,相当于保存


1字符编码


在文件处理过程中,首先有一个重要的概念,就是字符编码


字符编码:把人类的字符编译成计算机能认识的数字


字符编码表:就是一张字符与数字对应关系的表

ascii

gbk

utf-8          (硬盘中常用编码)

unicode       (内存中常用编码)

 

unicode ---->encode(‘utf-8’) 编码----> bytes

bytes ----> decode(‘utf-8’)解码 ----> Unicode

原则:字符以什么格式编译的,就要以什么格式解码

python3中的字符串分为两种
x='egon'              默认存为unicode
y=x.encode('utf-8')        使用encode编码为bytes

python2中字符串也分为两种
x=u'egon'              加u表示存为Unicode格式,python3的字符串一样
y='alex'               默认存为bytes

 

2、文件模式

r     文本模式的读,在文件不存在,不会创建新文件

w     文本模式的写,文件存在则清空,不存在则创建

a      文本模式的追加,文件存在光标跳到文件末尾,文件不存在创建

rb     即直接从硬盘中读取bytes

wb     以二进制写模式打开

ab     以二进制追加模式打开

r+     读的时候可写

w+     写的时候可读

a+     追加时可读写

 

a. r模式

f.read()       #一次性读取文本中全部的内容,以字符串的形式返回结果

read()的使用:

read(3)       #文件打开方式为文本模式时,代表读取3个字符

             #文件打开方式为b模式时,代表读取3个字节

             #unicode格式3个字节=1个字符

 

控制光标的移动(都是以字节为单位):

f.seek()      #控制光标移动几个字节

有三种模式:

0             从首字节开始

1    b模式下运行,以当前光标所在的位置为参照物

2    b模式下运行,以最后一个字节为参照物

练习:模拟tail –faccess.log

1
2
3
4
5
6
7
8
9
10
11
12
13
# python3 tail.py -f access.log
import  time
import  sys
 
with  open (r '%s'  %  sys.argv[ 2 ],  'rb' ) as f:
     f.seek( 0 2 )
 
     while  True :
         line  =  f.readline()
         if  line:
             print (line.decode( 'utf-8' ),end = '')
         else :
             time.sleep( 0.2 )

 

truncate()    #文件的打开方式为可写,从文件开头开始截取,留下指定字节之后的字节

 

 

f.readline()       #只读取文本第一行的内容,以字符串的形式返回结果

f.readlines()        #读取文本所有内容,并且以数列的格式返回结果,一般配合for in使用

f.readble()        #判断文件是否有读的权限,返回布尔值

 

b. w模式

f.write()          #写入文件,换行需要手动写换行符\n

f.writelines()           #一次写入多行

 

c. a模式

f.tell()              #查看光标位置

 

with open(‘文件’,’w’,encoding=’utf-8’) as f:    

      f.write(‘11111\n’)     #会把文件的内容赋值给f,执行完毕会自动close

 

python中把脚本后的参数传入脚本内的方法:

import sys

print(sys.argv)

一个cp文件的python小脚本

1
2
3
4
5
6
7
8
9
10
11
12
13
import  sys
 
#python3 copy.py source.file target.file
if  len (sys.argv) <  3 :
     print ( 'Usage:python3 copy.py source.file target.file' )
     sys.exit()
 
#r'C:\Users\Administrator\PycharmProjects\python18期周末班\day3\test.jpg'
with  open (r '%s'  % sys.argv[ 1 ], 'rb' ) as read_f,\
         open (r '%s'  % sys.argv[ 2 ], 'wb' ) as write_f:
 
     for  line  in  read_f:
         write_f.write(line)

本文转自lyndon博客51CTO博客,原文链接http://blog.51cto.com/lyndon/1948655如需转载请自行联系原作者

迟到的栋子
相关文章
|
11天前
|
机器学习/深度学习 存储 算法
解锁文件共享软件背后基于 Python 的二叉搜索树算法密码
文件共享软件在数字化时代扮演着连接全球用户、促进知识与数据交流的重要角色。二叉搜索树作为一种高效的数据结构,通过有序存储和快速检索文件,极大提升了文件共享平台的性能。它依据文件名或时间戳等关键属性排序,支持高效插入、删除和查找操作,显著优化用户体验。本文还展示了用Python实现的简单二叉搜索树代码,帮助理解其工作原理,并展望了该算法在分布式计算和机器学习领域的未来应用前景。
|
21天前
|
监控 网络安全 开发者
Python中的Paramiko与FTP文件夹及文件检测技巧
通过使用 Paramiko 和 FTP 库,开发者可以方便地检测远程服务器上的文件和文件夹是否存在。Paramiko 提供了通过 SSH 协议进行远程文件管理的能力,而 `ftplib` 则提供了通过 FTP 协议进行文件传输和管理的功能。通过理解和应用这些工具,您可以更加高效地管理和监控远程服务器上的文件系统。
51 20
|
27天前
|
存储 数据采集 数据处理
如何在Python中高效地读写大型文件?
大家好,我是V哥。上一篇介绍了Python文件读写操作,今天聊聊如何高效处理大型文件。主要方法包括:逐行读取、分块读取、内存映射(mmap)、pandas分块处理CSV、numpy处理二进制文件、itertools迭代处理及linecache逐行读取。这些方法能有效节省内存,提升效率。关注威哥爱编程,学习更多Python技巧。
|
28天前
|
存储 JSON 对象存储
如何使用 Python 进行文件读写操作?
大家好,我是V哥。本文介绍Python中文件读写操作的方法,包括文件读取、写入、追加、二进制模式、JSON、CSV和Pandas模块的使用,以及对象序列化与反序列化。通过这些方法,你可以根据不同的文件类型和需求,灵活选择合适的方式进行操作。希望对正在学习Python的小伙伴们有所帮助。欢迎关注威哥爱编程,全栈路上我们并肩前行。
|
1月前
|
存储 算法 Serverless
剖析文件共享工具背后的Python哈希表算法奥秘
在数字化时代,文件共享工具不可或缺。哈希表算法通过将文件名或哈希值映射到存储位置,实现快速检索与高效管理。Python中的哈希表可用于创建简易文件索引,支持快速插入和查找文件路径。哈希表不仅提升了文件定位速度,还优化了存储管理和多节点数据一致性,确保文件共享工具高效运行,满足多用户并发需求,推动文件共享领域向更高效、便捷的方向发展。
|
2月前
|
计算机视觉 Python
如何使用Python将TS文件转换为MP4
本文介绍了如何使用Python和FFmpeg将TS文件转换为MP4文件。首先需要安装Python和FFmpeg,然后通过`subprocess`模块调用FFmpeg命令,实现文件格式的转换。代码示例展示了具体的操作步骤,包括检查文件存在性、构建FFmpeg命令和执行转换过程。
76 7
|
3月前
|
中间件 Docker Python
【Azure Function】FTP上传了Python Function文件后,无法在门户页面加载函数的问题
通过FTP上传Python Function至Azure云后,出现函数列表无法加载的问题。经排查,发现是由于`requirements.txt`中的依赖包未被正确安装。解决方法为:在本地安装依赖包到`.python_packages/lib/site-packages`目录,再将该目录内容上传至云上的`wwwroot`目录,并重启应用。最终成功加载函数列表。
|
3月前
|
开发者 Python
Python中__init__.py文件的作用
`__init__.py`文件在Python包管理中扮演着重要角色,通过标识目录为包、初始化包、控制导入行为、支持递归包结构以及定义包的命名空间,`__init__.py`文件为组织和管理Python代码提供了强大支持。理解并正确使用 `__init__.py`文件,可以帮助开发者更好地组织代码,提高代码的可维护性和可读性。
178 2
|
4月前
|
Java Python
> python知识点100篇系列(19)-使用python下载文件的几种方式
【10月更文挑战第7天】本文介绍了使用Python下载文件的五种方法,包括使用requests、wget、线程池、urllib3和asyncio模块。每种方法适用于不同的场景,如单文件下载、多文件并发下载等,提供了丰富的选择。
|
4月前
|
数据安全/隐私保护 流计算 开发者
python知识点100篇系列(18)-解析m3u8文件的下载视频
【10月更文挑战第6天】m3u8是苹果公司推出的一种视频播放标准,采用UTF-8编码,主要用于记录视频的网络地址。HLS(Http Live Streaming)是苹果公司提出的一种基于HTTP的流媒体传输协议,通过m3u8索引文件按序访问ts文件,实现音视频播放。本文介绍了如何通过浏览器找到m3u8文件,解析m3u8文件获取ts文件地址,下载ts文件并解密(如有必要),最后使用ffmpeg合并ts文件为mp4文件。
109 1

热门文章

最新文章

推荐镜像

更多