Python文件相关知识点strip、open、read、write、close、readline、readlines、encoding、encode、decode

简介: 文件的作用: 可以永久的保存数据.文件在硬盘中存储的格式是二进制.打开文件读写文件关闭文件打开文件, 是文件从硬盘中存到内存中open(file, mode=‘r’, encoding)file 要操作的文件名字, 类型是 strmode, 文件打开的方式, r(read) 只读打开, w(write) 只写打开 a(append) 追加打开encoding 文件的编码格式, 常见的编码格式有两种, 一种是gbk, 一种是utf-8返回值, 文件对象, 后续所有的文件操作,都需要通

@[toc]

1.文件操作

文件的作用: 可以永久的保存数据.
文件在硬盘中存储的格式是二进制.
打开文件
读写文件
关闭文件

在这里插入图片描述
在这里插入图片描述

1.1读文件-r

打开文件, 是文件从硬盘中存到内存中
open(file, mode='r', encoding)
file 要操作的文件名字, 类型是 str
mode, 文件打开的方式, r(read) 只读打开, w(write) 只写打开 a(append) 追加打开
encoding 文件的编码格式, 常见的编码格式有两种, 一种是gbk, 一种是utf-8
返回值, 文件对象, 后续所有的文件操作,都需要通过这个文件对象进行

# 以只读的方式打开当前目录中,text1.txt 文件, 文件不存在会报错
f = open('text1.txt', 'r')
# 2. 读文件 文件对象.read()
buf = f.read()
print(buf)
# 3. 关闭文件  文件.close()  将内存中三大文件同步到硬盘中
f.close()

1.2写文件-w

  1. open函数打开文件,没有指定文件的编码,windows默认是gbk,Mac和linux默认是utf-8
  2. write函数将“你好,中国”写入文件中,使用gbk编码写入
  3. 在pycharm中双击打开文件,默认使用的编码是utf-8
  4. 使用utf-8编码打开gbk 编码的数据,出现乱码

编码︰就是如何将中文汉字变为二进制,或者如何将二进制转换为汉字
解决方案:是两种方式的编码统─即可
方案一:open打开文件的时候,指定使用utf-8打开
方案二: pycharm中使用gbk 的方式打开

1.2.1方案一:

# 1. 打开文件 w 方式打开文件,文件不存在,会创建文件, 文件存在,会覆盖清空原文件
f = open('a.txt', 'w', encoding='utf-8')
# 2. 写文件 文件对象.write(写入文件的内容)
f.write('hello world!\n')
f.write('hello python!\n')
f.write('你好,中国!')
# 3. 关闭文件
f.close()

1.2.2方案二:

在这里插入图片描述
将这里改成GBK

1.3追加文件-a

a 方式打开文件, 追加内容,在文件的末尾写入内容
文件不存在,会创建文件
注意点: 不管是a 方式打开文件,还是 w 方式打开文件,写内容,都是使用 write()函数

f = open('b.txt', 'a', encoding='utf-8')
# f.write('hello world!\n')
f.write('123\n')
f.close()

1.4文件的读操作

1.4.1read()

# 1. 打开文件
f = open('a.txt', 'r', encoding='utf-8')
# 2. 读写文件 文件对象.read(n)  n 一次读取多少字节的内容,默认不写,读取全部内容
buf = f.read(3)
print(buf)  # 123
print('-'*30)
buf = f.read(3)  #
print(buf)
# 3. 关闭文件
f.close()

在这里插入图片描述

1.4.2按行读取

.strip是可以把字符串中的空格\n去掉

f = open('a.txt', 'r', encoding='utf-8')
# f.readline()  # 一次读取一行的内容, 返回值是读取到的内容(str)
# buf = f.readline()

# f.readlines()  # 按行读取,一次读取所有行,返回值是列表, 列表中的每一项是一个字符串,即一行的内容
buf = f.readlines()
print(buf)  # ['1234\n', '5678']
buf = [i.strip() for i in buf]
print(buf)  # ['1234', '5678']
f.close()

1.4.3模拟读取大文件

end=''打印的时候不会换行

情况一:大文件分为好几行

f = open('a.txt', 'r', encoding='utf-8')
while True:
    buf = f.readline()
    if buf:  # if len(buf) > 0   容器,可以直接作为判断条件,容器中有内容,为True,没有数据是False
        print(buf, end='')
    else:
        # 文件读完了
        break

f.close()

情况二:大文件只有一行

f = open('b.txt', 'r', encoding='utf-8')
while True:
    buf = f.read(5)  # f.read(4096)
    if buf:
        # print(buf, end='')
        print(buf)
    else:
        break

f.close()

4.4.4补充: 计算机中的大小

计算机只认识 0 和 1 ,
进制:
二进制, 只有 0 和 1 组成,逢二进一
十进制, 0 1 2 3 4 5 6 7 8 9 , 逢十进一
十六进制, 0 1 2 3 4 5 6 7 8 9 A B C D E F 逢十六进一

计算机最小的单位是 bit(位), 只有两个数据值 0 和 1
字节: 是计算机中基本的储存单位 byte

1 byte = 8 bit

1KB = 1024 byte
1MB = 1024 KB
1GB = 1024 MB
1TB = 1024 GB
...
100Mbits 200Mbits
12.5MB/s 25MB/s

1.5文件打开模式

文本文件: txt, .py .md 能够使用记事本打开的文件
二进制文件: 具有特殊格式的文件, mp3 mp4 rmvb avi png jpg 等
文本文件可以使用 文本方式打开文件,也可以使用二进制的方式打开文件
二进制文件,只能使用二进制的方式打开文件
二进制打开方式如下: 不管读取,还是书写,都需要使用二进制的数据
rb wb ab
注意点: 不能指定 encoding 参数

encode() 将str 转换为二进制格式的字符串

decode() 将二进制格式的字符串转换为str

f = open('c.txt', 'wb')
f.write('你好'.encode())   # encode() 将str 转换为二进制格式的字符串
f.close()


f1 = open('c.txt', 'rb')
buf = f1.read()
print(buf)
print(buf.decode())
f1.close()

1.6应用-文件备份

  1. 用只读的方式,打开文件
  2. 读取文件内容
  3. 关闭文件
  4. 只写的方式,打开新文件
  5. 将 第 2 步读取的内容写入新文件
  6. 关闭新文件
  7. 思考:

    1. 如果文件比较大,循环读取文件
    2. 复制备份的文件可能是 txt 文件,可能是 二进制文件, ---> 使用二进制方式打开文件

普通备份

# 1. 用只读的方式,打开文件
f = open('a.txt', 'rb')
# 2. 读取文件内容
buf = f.read()
# 3. 关闭文件
f.close()
# 4. 只写的方式,打开新文件
f_w = open('a[备份].txt', 'wb')
# 5. 将 第 2 步读取的内容写入新文件
f_w.write(buf)
# 6. 关闭新文件
f_w.close()

优化备份

file_name = input('请输入要备份的文件名')

# 1. 用只读的方式,打开文件
f = open(file_name, 'rb')
# 2. 读取文件内容
buf = f.read()
# 3. 关闭文件
f.close()

# 根据原文件名,找到文件后缀和文件名
index = file_name.rfind('.')
# 后缀  file_name[index: ]
# 新文件名
new_file_name = file_name[:index] + '[备份]' + file_name[index:]
print(new_file_name)
# 4. 只写的方式,打开新文件
f_w = open(new_file_name, 'wb')
# 5. 将 第 2 步读取的内容写入新文件
f_w.write(buf)
# 6. 关闭新文件
f_w.close()

为什么要用rfind呢,是因为如果文件名为a.b.txt则也可以正确的找到txt后缀

1.7文件和文件夹的操作

1.7.1文件重命名

import os
os.rename("ab.txt", "abcc.txt")

1.7.2删除文件

import os
os.remove("abcc.txt")

1.7.3创建文件夹

import os
os.mkdir("诸葛亮")

1.7.4获取当前目录

import os
os.getcwd()

1.7.5改变默认目录

import os
os.chdir("../")

1.7.6获取目录列表

import os
os.listdir("./")

1.7.7删除文件夹

import os
os.rmdir("诸葛亮")
# 对文件和目录的操作,需要导入 os 模块
import os

# 1. 文件重命名 os.rename(原文件路径名, 新文件路径名)
os.rename('ab.txt', 'abcc.txt')
# 2. 删除文件 os.remove(文件的路径名)
os.remove('abcc.txt')
# 3. 创建目录 os.mkdir(目录路径名)  make directory
os.mkdir('test')
os.mkdir('test/aa')

# 4. 删除空目录  os.rmdir(目录名)  remove directory
os.rmdir('test/aa')
os.rmdir('test')
# 5. 获取当前所在的目录 os.getcwd()  get current working directory
buf = os.getcwd()
print(buf)
# 6. 修改当前的目录 os.chdir(目录名)  change dir
os.chdir('test')
buf = os.getcwd()
print(buf)
# 7. 获取指定目录中的内容,  os.listdir(目录), 默认不写参数,是获取当前目录中的内容
# 返回值是列表, 列表中的每一项是文件名
buf = os.listdir()   # test
print(buf)

1.8应用-批量修改文件名

import os

# 批量创建txt文本
def create_files():
    for i in range(10):
        file_name = 'test/file_' + str(i) + '.txt'
        print(file_name)
        f = open(file_name, 'w')
        f.close()

# 批量创建txt文本
def create_files_1():
    os.chdir('test')
    for i in range(10, 20):
        file_name = 'file_' + str(i) + '.txt'
        print(file_name)
        f = open(file_name, 'w')
        f.close()
    os.chdir('../')  # ../ 上一级目录

# 批量修改文本名字
def modify_filename():
    os.chdir('test')
    buf_list = os.listdir()
    # print(buf_list)
    for file in buf_list:
        new_file = 'py43_' + file
        os.rename(file, new_file)

    os.chdir('../')

# 批量修改文本名字
def modify_filename_1():
    os.chdir('test')
    buf_list = os.listdir()
    # print(buf_list)
    for file in buf_list:
        num = len('py43_')
        new_file = file[num:]
        os.rename(file, new_file)

    os.chdir('../')


# create_files()
# create_files_1()
# modify_filename()
# modify_filename_1()
目录
相关文章
|
1天前
|
Python
Python知识点——文件和数据格式化
Python知识点——文件和数据格式化
5 0
|
2天前
|
存储 JSON 安全
Python中的文件操作与文件IO操作
【5月更文挑战第14天】在Python中,文件操作是常见任务,包括读取、写入和处理文件内容。`open()`函数是核心,接受文件路径和模式(如'r'、'w'、'a'、'b'和'+')参数。本文详细讨论了文件操作基础,如读写模式,以及文件IO操作,如读取、写入和移动指针。异常处理是关键,使用`try-except`捕获`FileNotFoundError`和`PermissionError`等异常。进阶技巧涉及`with`语句、`readline()`、`os`和`shutil`模块。数据序列化与反序列化方面,介绍了
14 0
|
2天前
|
Python
Python代码扫描目录下的文件并获取路径
【5月更文挑战第12天】Python代码扫描目录下的文件并获取路径
17 1
|
2天前
|
Python
python如何读取excel文件,并修改内容?
python如何读取excel文件,并修改内容?
7 0
|
Python
Python strip 内置方法使用上的误区
最近在调查配置问题过程中,发现一个比较低级的错误,应该是 python 使用习惯的问题,和大家分享一下,比较有意思。 问题介绍 在系统的配置脚本中有一句这样的逻辑: # etcd_nodes like this: 'http://172.16.1.1:2380' etcd_nodes.append(etcd_node_host.rstrip(':2380').lstrip('http://')) 我们预期的结果当然是获取到 '172.16.1.1' 这个 IP 地址。
3747 0
|
2天前
|
存储 人工智能 数据处理
Python:编程的艺术与科学的完美交融
Python:编程的艺术与科学的完美交融
19 1
|
1天前
|
网络协议 Unix Python
Python编程-----网络通信
Python编程-----网络通信
8 1
|
2天前
|
JSON 数据格式 开发者
pip和requests在Python编程中各自扮演着不同的角色
【5月更文挑战第9天】`pip`是Python的包管理器,用于安装、升级和管理PyPI上的包;`requests`是一个HTTP库,简化了HTTP通信,支持各种HTTP请求类型及数据交互。两者在Python环境中分别负责包管理和网络请求。
31 5
|
2天前
|
存储 Python 容器
Python高级编程
Python集合包括可变的set和不可变的frozenset,用于存储无序、不重复的哈希元素。创建集合可使用{}或set(),如`my_set = {1, 2, 3, 4, 5}`。通过add()添加元素,remove()或discard()删除元素,如`my_set.remove(3)`。
13 0
|
2天前
|
测试技术 Python
Python模块化方式编程实践
【5月更文挑战第5天】Python模块化编程提升代码质量,包括:定义专注单一任务的模块;使用`import`导入模块;封装函数和类,明确命名便于重用;避免全局变量降低耦合;使用文档字符串增强可读性;为每个模块写单元测试确保正确性;重用模块作为库;定期维护更新以适应Python新版本。遵循这些实践,可提高代码可读性、重用性和可维护性。
43 2