python基础---文件处理

简介:

文件处理



f=open(‘文件’r’)         打开一个文件

f.close()                关闭文件,相当于保存


1字符编码


在文件处理过程中,首先有一个重要的概念,就是字符编码


字符编码:把人类的字符编译成计算机能认识的数字


字符编码表:就是一张字符与数字对应关系的表

ascii

gbk

utf-8          (硬盘中常用编码)

unicode       (内存中常用编码)

 

unicode ---->encode(‘utf-8’) 编码----> bytes

bytes ----> decode(‘utf-8’)解码 ----> Unicode

原则:字符以什么格式编译的,就要以什么格式解码

python3中的字符串分为两种
x='egon'              默认存为unicode
y=x.encode('utf-8')        使用encode编码为bytes

python2中字符串也分为两种
x=u'egon'              加u表示存为Unicode格式,python3的字符串一样
y='alex'               默认存为bytes

 

2、文件模式

r     文本模式的读,在文件不存在,不会创建新文件

w     文本模式的写,文件存在则清空,不存在则创建

a      文本模式的追加,文件存在光标跳到文件末尾,文件不存在创建

rb     即直接从硬盘中读取bytes

wb     以二进制写模式打开

ab     以二进制追加模式打开

r+     读的时候可写

w+     写的时候可读

a+     追加时可读写

 

a. r模式

f.read()       #一次性读取文本中全部的内容,以字符串的形式返回结果

read()的使用:

read(3)       #文件打开方式为文本模式时,代表读取3个字符

             #文件打开方式为b模式时,代表读取3个字节

             #unicode格式3个字节=1个字符

 

控制光标的移动(都是以字节为单位):

f.seek()      #控制光标移动几个字节

有三种模式:

0             从首字节开始

1    b模式下运行,以当前光标所在的位置为参照物

2    b模式下运行,以最后一个字节为参照物

练习:模拟tail –faccess.log

1
2
3
4
5
6
7
8
9
10
11
12
13
# python3 tail.py -f access.log
import  time
import  sys
 
with  open (r '%s'  %  sys.argv[ 2 ],  'rb' ) as f:
     f.seek( 0 2 )
 
     while  True :
         line  =  f.readline()
         if  line:
             print (line.decode( 'utf-8' ),end = '')
         else :
             time.sleep( 0.2 )

 

truncate()    #文件的打开方式为可写,从文件开头开始截取,留下指定字节之后的字节

 

 

f.readline()       #只读取文本第一行的内容,以字符串的形式返回结果

f.readlines()        #读取文本所有内容,并且以数列的格式返回结果,一般配合for in使用

f.readble()        #判断文件是否有读的权限,返回布尔值

 

b. w模式

f.write()          #写入文件,换行需要手动写换行符\n

f.writelines()           #一次写入多行

 

c. a模式

f.tell()              #查看光标位置

 

with open(‘文件’,’w’,encoding=’utf-8’) as f:    

      f.write(‘11111\n’)     #会把文件的内容赋值给f,执行完毕会自动close

 

python中把脚本后的参数传入脚本内的方法:

import sys

print(sys.argv)

一个cp文件的python小脚本

1
2
3
4
5
6
7
8
9
10
11
12
13
import  sys
 
#python3 copy.py source.file target.file
if  len (sys.argv) <  3 :
     print ( 'Usage:python3 copy.py source.file target.file' )
     sys.exit()
 
#r'C:\Users\Administrator\PycharmProjects\python18期周末班\day3\test.jpg'
with  open (r '%s'  % sys.argv[ 1 ], 'rb' ) as read_f,\
         open (r '%s'  % sys.argv[ 2 ], 'wb' ) as write_f:
 
     for  line  in  read_f:
         write_f.write(line)

本文转自lyndon博客51CTO博客,原文链接http://blog.51cto.com/lyndon/1948655如需转载请自行联系原作者

迟到的栋子
相关文章
|
3天前
|
存储 数据采集 数据处理
如何在Python中高效地读写大型文件?
大家好,我是V哥。上一篇介绍了Python文件读写操作,今天聊聊如何高效处理大型文件。主要方法包括:逐行读取、分块读取、内存映射(mmap)、pandas分块处理CSV、numpy处理二进制文件、itertools迭代处理及linecache逐行读取。这些方法能有效节省内存,提升效率。关注威哥爱编程,学习更多Python技巧。
|
3天前
|
存储 JSON 对象存储
如何使用 Python 进行文件读写操作?
大家好,我是V哥。本文介绍Python中文件读写操作的方法,包括文件读取、写入、追加、二进制模式、JSON、CSV和Pandas模块的使用,以及对象序列化与反序列化。通过这些方法,你可以根据不同的文件类型和需求,灵活选择合适的方式进行操作。希望对正在学习Python的小伙伴们有所帮助。欢迎关注威哥爱编程,全栈路上我们并肩前行。
|
18天前
|
存储 算法 Serverless
剖析文件共享工具背后的Python哈希表算法奥秘
在数字化时代,文件共享工具不可或缺。哈希表算法通过将文件名或哈希值映射到存储位置,实现快速检索与高效管理。Python中的哈希表可用于创建简易文件索引,支持快速插入和查找文件路径。哈希表不仅提升了文件定位速度,还优化了存储管理和多节点数据一致性,确保文件共享工具高效运行,满足多用户并发需求,推动文件共享领域向更高效、便捷的方向发展。
|
1月前
|
计算机视觉 Python
如何使用Python将TS文件转换为MP4
本文介绍了如何使用Python和FFmpeg将TS文件转换为MP4文件。首先需要安装Python和FFmpeg,然后通过`subprocess`模块调用FFmpeg命令,实现文件格式的转换。代码示例展示了具体的操作步骤,包括检查文件存在性、构建FFmpeg命令和执行转换过程。
58 7
|
3月前
|
自然语言处理 数据处理 Python
python操作和解析ppt文件 | python小知识
本文将带你从零开始,了解PPT解析的工具、工作原理以及常用的基本操作,并提供具体的代码示例和必要的说明【10月更文挑战第4天】
626 60
|
3月前
|
安全 Linux 数据安全/隐私保护
python知识点100篇系列(15)-加密python源代码为pyd文件
【10月更文挑战第5天】为了保护Python源码不被查看,可将其编译成二进制文件(Windows下为.pyd,Linux下为.so)。以Python3.8为例,通过Cython工具,先写好Python代码并加入`# cython: language_level=3`指令,安装easycython库后,使用`easycython *.py`命令编译源文件,最终生成.pyd文件供直接导入使用。
123 3
python知识点100篇系列(15)-加密python源代码为pyd文件
|
2月前
|
开发者 Python
Python中__init__.py文件的作用
`__init__.py`文件在Python包管理中扮演着重要角色,通过标识目录为包、初始化包、控制导入行为、支持递归包结构以及定义包的命名空间,`__init__.py`文件为组织和管理Python代码提供了强大支持。理解并正确使用 `__init__.py`文件,可以帮助开发者更好地组织代码,提高代码的可维护性和可读性。
154 2
|
3月前
|
Linux 区块链 Python
Python实用记录(十三):python脚本打包exe文件并运行
这篇文章介绍了如何使用PyInstaller将Python脚本打包成可执行文件(exe),并提供了详细的步骤和注意事项。
155 1
Python实用记录(十三):python脚本打包exe文件并运行
|
2月前
|
中间件 Docker Python
【Azure Function】FTP上传了Python Function文件后,无法在门户页面加载函数的问题
通过FTP上传Python Function至Azure云后,出现函数列表无法加载的问题。经排查,发现是由于`requirements.txt`中的依赖包未被正确安装。解决方法为:在本地安装依赖包到`.python_packages/lib/site-packages`目录,再将该目录内容上传至云上的`wwwroot`目录,并重启应用。最终成功加载函数列表。
|
3月前
|
Java Python
> python知识点100篇系列(19)-使用python下载文件的几种方式
【10月更文挑战第7天】本文介绍了使用Python下载文件的五种方法,包括使用requests、wget、线程池、urllib3和asyncio模块。每种方法适用于不同的场景,如单文件下载、多文件并发下载等,提供了丰富的选择。

热门文章

最新文章