Python文件相关知识点strip、open、read、write、close、readline、readlines、encoding、encode、decode

简介: 文件的作用: 可以永久的保存数据.文件在硬盘中存储的格式是二进制.打开文件读写文件关闭文件打开文件, 是文件从硬盘中存到内存中open(file, mode=‘r’, encoding)file 要操作的文件名字, 类型是 strmode, 文件打开的方式, r(read) 只读打开, w(write) 只写打开 a(append) 追加打开encoding 文件的编码格式, 常见的编码格式有两种, 一种是gbk, 一种是utf-8返回值, 文件对象, 后续所有的文件操作,都需要通

@[toc]

1.文件操作

文件的作用: 可以永久的保存数据.
文件在硬盘中存储的格式是二进制.
打开文件
读写文件
关闭文件

在这里插入图片描述
在这里插入图片描述

1.1读文件-r

打开文件, 是文件从硬盘中存到内存中
open(file, mode='r', encoding)
file 要操作的文件名字, 类型是 str
mode, 文件打开的方式, r(read) 只读打开, w(write) 只写打开 a(append) 追加打开
encoding 文件的编码格式, 常见的编码格式有两种, 一种是gbk, 一种是utf-8
返回值, 文件对象, 后续所有的文件操作,都需要通过这个文件对象进行

# 以只读的方式打开当前目录中,text1.txt 文件, 文件不存在会报错
f = open('text1.txt', 'r')
# 2. 读文件 文件对象.read()
buf = f.read()
print(buf)
# 3. 关闭文件  文件.close()  将内存中三大文件同步到硬盘中
f.close()

1.2写文件-w

  1. open函数打开文件,没有指定文件的编码,windows默认是gbk,Mac和linux默认是utf-8
  2. write函数将“你好,中国”写入文件中,使用gbk编码写入
  3. 在pycharm中双击打开文件,默认使用的编码是utf-8
  4. 使用utf-8编码打开gbk 编码的数据,出现乱码

编码︰就是如何将中文汉字变为二进制,或者如何将二进制转换为汉字
解决方案:是两种方式的编码统─即可
方案一:open打开文件的时候,指定使用utf-8打开
方案二: pycharm中使用gbk 的方式打开

1.2.1方案一:

# 1. 打开文件 w 方式打开文件,文件不存在,会创建文件, 文件存在,会覆盖清空原文件
f = open('a.txt', 'w', encoding='utf-8')
# 2. 写文件 文件对象.write(写入文件的内容)
f.write('hello world!\n')
f.write('hello python!\n')
f.write('你好,中国!')
# 3. 关闭文件
f.close()

1.2.2方案二:

在这里插入图片描述
将这里改成GBK

1.3追加文件-a

a 方式打开文件, 追加内容,在文件的末尾写入内容
文件不存在,会创建文件
注意点: 不管是a 方式打开文件,还是 w 方式打开文件,写内容,都是使用 write()函数

f = open('b.txt', 'a', encoding='utf-8')
# f.write('hello world!\n')
f.write('123\n')
f.close()

1.4文件的读操作

1.4.1read()

# 1. 打开文件
f = open('a.txt', 'r', encoding='utf-8')
# 2. 读写文件 文件对象.read(n)  n 一次读取多少字节的内容,默认不写,读取全部内容
buf = f.read(3)
print(buf)  # 123
print('-'*30)
buf = f.read(3)  #
print(buf)
# 3. 关闭文件
f.close()

在这里插入图片描述

1.4.2按行读取

.strip是可以把字符串中的空格\n去掉

f = open('a.txt', 'r', encoding='utf-8')
# f.readline()  # 一次读取一行的内容, 返回值是读取到的内容(str)
# buf = f.readline()

# f.readlines()  # 按行读取,一次读取所有行,返回值是列表, 列表中的每一项是一个字符串,即一行的内容
buf = f.readlines()
print(buf)  # ['1234\n', '5678']
buf = [i.strip() for i in buf]
print(buf)  # ['1234', '5678']
f.close()

1.4.3模拟读取大文件

end=''打印的时候不会换行

情况一:大文件分为好几行

f = open('a.txt', 'r', encoding='utf-8')
while True:
    buf = f.readline()
    if buf:  # if len(buf) > 0   容器,可以直接作为判断条件,容器中有内容,为True,没有数据是False
        print(buf, end='')
    else:
        # 文件读完了
        break

f.close()

情况二:大文件只有一行

f = open('b.txt', 'r', encoding='utf-8')
while True:
    buf = f.read(5)  # f.read(4096)
    if buf:
        # print(buf, end='')
        print(buf)
    else:
        break

f.close()

4.4.4补充: 计算机中的大小

计算机只认识 0 和 1 ,
进制:
二进制, 只有 0 和 1 组成,逢二进一
十进制, 0 1 2 3 4 5 6 7 8 9 , 逢十进一
十六进制, 0 1 2 3 4 5 6 7 8 9 A B C D E F 逢十六进一

计算机最小的单位是 bit(位), 只有两个数据值 0 和 1
字节: 是计算机中基本的储存单位 byte

1 byte = 8 bit

1KB = 1024 byte
1MB = 1024 KB
1GB = 1024 MB
1TB = 1024 GB
...
100Mbits 200Mbits
12.5MB/s 25MB/s

1.5文件打开模式

文本文件: txt, .py .md 能够使用记事本打开的文件
二进制文件: 具有特殊格式的文件, mp3 mp4 rmvb avi png jpg 等
文本文件可以使用 文本方式打开文件,也可以使用二进制的方式打开文件
二进制文件,只能使用二进制的方式打开文件
二进制打开方式如下: 不管读取,还是书写,都需要使用二进制的数据
rb wb ab
注意点: 不能指定 encoding 参数

encode() 将str 转换为二进制格式的字符串

decode() 将二进制格式的字符串转换为str

f = open('c.txt', 'wb')
f.write('你好'.encode())   # encode() 将str 转换为二进制格式的字符串
f.close()


f1 = open('c.txt', 'rb')
buf = f1.read()
print(buf)
print(buf.decode())
f1.close()

1.6应用-文件备份

  1. 用只读的方式,打开文件
  2. 读取文件内容
  3. 关闭文件
  4. 只写的方式,打开新文件
  5. 将 第 2 步读取的内容写入新文件
  6. 关闭新文件
  7. 思考:

    1. 如果文件比较大,循环读取文件
    2. 复制备份的文件可能是 txt 文件,可能是 二进制文件, ---> 使用二进制方式打开文件

普通备份

# 1. 用只读的方式,打开文件
f = open('a.txt', 'rb')
# 2. 读取文件内容
buf = f.read()
# 3. 关闭文件
f.close()
# 4. 只写的方式,打开新文件
f_w = open('a[备份].txt', 'wb')
# 5. 将 第 2 步读取的内容写入新文件
f_w.write(buf)
# 6. 关闭新文件
f_w.close()

优化备份

file_name = input('请输入要备份的文件名')

# 1. 用只读的方式,打开文件
f = open(file_name, 'rb')
# 2. 读取文件内容
buf = f.read()
# 3. 关闭文件
f.close()

# 根据原文件名,找到文件后缀和文件名
index = file_name.rfind('.')
# 后缀  file_name[index: ]
# 新文件名
new_file_name = file_name[:index] + '[备份]' + file_name[index:]
print(new_file_name)
# 4. 只写的方式,打开新文件
f_w = open(new_file_name, 'wb')
# 5. 将 第 2 步读取的内容写入新文件
f_w.write(buf)
# 6. 关闭新文件
f_w.close()

为什么要用rfind呢,是因为如果文件名为a.b.txt则也可以正确的找到txt后缀

1.7文件和文件夹的操作

1.7.1文件重命名

import os
os.rename("ab.txt", "abcc.txt")

1.7.2删除文件

import os
os.remove("abcc.txt")

1.7.3创建文件夹

import os
os.mkdir("诸葛亮")

1.7.4获取当前目录

import os
os.getcwd()

1.7.5改变默认目录

import os
os.chdir("../")

1.7.6获取目录列表

import os
os.listdir("./")

1.7.7删除文件夹

import os
os.rmdir("诸葛亮")
# 对文件和目录的操作,需要导入 os 模块
import os

# 1. 文件重命名 os.rename(原文件路径名, 新文件路径名)
os.rename('ab.txt', 'abcc.txt')
# 2. 删除文件 os.remove(文件的路径名)
os.remove('abcc.txt')
# 3. 创建目录 os.mkdir(目录路径名)  make directory
os.mkdir('test')
os.mkdir('test/aa')

# 4. 删除空目录  os.rmdir(目录名)  remove directory
os.rmdir('test/aa')
os.rmdir('test')
# 5. 获取当前所在的目录 os.getcwd()  get current working directory
buf = os.getcwd()
print(buf)
# 6. 修改当前的目录 os.chdir(目录名)  change dir
os.chdir('test')
buf = os.getcwd()
print(buf)
# 7. 获取指定目录中的内容,  os.listdir(目录), 默认不写参数,是获取当前目录中的内容
# 返回值是列表, 列表中的每一项是文件名
buf = os.listdir()   # test
print(buf)

1.8应用-批量修改文件名

import os

# 批量创建txt文本
def create_files():
    for i in range(10):
        file_name = 'test/file_' + str(i) + '.txt'
        print(file_name)
        f = open(file_name, 'w')
        f.close()

# 批量创建txt文本
def create_files_1():
    os.chdir('test')
    for i in range(10, 20):
        file_name = 'file_' + str(i) + '.txt'
        print(file_name)
        f = open(file_name, 'w')
        f.close()
    os.chdir('../')  # ../ 上一级目录

# 批量修改文本名字
def modify_filename():
    os.chdir('test')
    buf_list = os.listdir()
    # print(buf_list)
    for file in buf_list:
        new_file = 'py43_' + file
        os.rename(file, new_file)

    os.chdir('../')

# 批量修改文本名字
def modify_filename_1():
    os.chdir('test')
    buf_list = os.listdir()
    # print(buf_list)
    for file in buf_list:
        num = len('py43_')
        new_file = file[num:]
        os.rename(file, new_file)

    os.chdir('../')


# create_files()
# create_files_1()
# modify_filename()
# modify_filename_1()
目录
相关文章
|
7月前
|
存储 Python
Python中encode和encoding的区别
Python中encode和encoding的区别
97 0
|
6月前
|
Python
Python的文件对象readline()
【6月更文挑战第8天】
41 5
|
6月前
|
移动开发 Python
Python的文件对象open()
【6月更文挑战第8天】
42 5
|
3月前
|
Python
Python 中如何指定 open 编码为ANSI
Python 中如何指定 open 编码为ANSI
|
5月前
|
编解码 开发者 Python
【Python】已解决:UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\u0157’ in position 1: illegal m
【Python】已解决:UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\u0157’ in position 1: illegal m
60 1
|
5月前
|
编解码 测试技术 Python
【Python】已解决:UnicodeEncodeError: ‘ascii’ codec can’t encode characters in position 0-1: ordinal not i
【Python】已解决:UnicodeEncodeError: ‘ascii’ codec can’t encode characters in position 0-1: ordinal not i
820 1
|
5月前
|
编解码 开发者 Python
【Python】已解决:UnicodeEncodeError: ‘utf-8’ codec can’t encode characters in position 42-43: surrogates
【Python】已解决:UnicodeEncodeError: ‘utf-8’ codec can’t encode characters in position 42-43: surrogates
447 0
|
5月前
|
XML 数据采集 编解码
【Python】已解决:UnicodeEncodeError: ‘utf-8’ codec can’t encode character ‘\udf76’ in position 32: surrog
【Python】已解决:UnicodeEncodeError: ‘utf-8’ codec can’t encode character ‘\udf76’ in position 32: surrog
38 0
|
7月前
|
存储 安全 Linux
python文件操作open的使用方法详解
python文件操作open的使用方法详解
|
10天前
|
存储 数据挖掘 开发者
Python编程入门:从零到英雄
在这篇文章中,我们将一起踏上Python编程的奇幻之旅。无论你是编程新手,还是希望拓展技能的开发者,本教程都将为你提供一条清晰的道路,引导你从基础语法走向实际应用。通过精心设计的代码示例和练习,你将学会如何用Python解决实际问题,并准备好迎接更复杂的编程挑战。让我们一起探索这个强大的语言,开启你的编程生涯吧!