08 Python学习之文件操作

简介: 计算机可以分为 文本文件 和 二进制文件

计算机可以分为 文本文件 和 二进制文件:

  • 文本文件 :可以使⽤⽂本编辑软件查看; 例如:python 的源程序 ,txt 文本文件等;
  • 二进制文件:保存的内容不是给⼈直接阅读的,⽽是提供给其他软件使⽤的 ; 例如:图⽚⽂件、⾳频⽂件、视频⽂件等等 ; ⼆进制⽂件不能使⽤⽂本编辑软件查看。

1、基本操作

在计算机中要操作文件的套路非常固定,一共包含三个步骤:

  1. 打开⽂件 ;
  2. 读、写⽂件 ;

    读: 将⽂件内容读⼊内存 ;

    写: 将内容写⼊⽂件 。

  3. 关闭⽂件 。

1.1 操作文件的函数/方法

在 Python 中要操作⽂件需要记住 1 个函数和 3 个方法。
序号 函数/方法 说明
1 open 打开文件,并且返回文件操作对象
2 read 将文件内容读取到内存
3 write 将指定内容写入文件
4 close 关闭文件
注:

1、open 函数的第⼀个参数是要打开的⽂件名(⽂件名区分⼤⼩写) ;

2、如果⽂件存在------返回⽂件操作对象 ;如果⽂件不存在------出错 ;

3、如果忘记关闭⽂件,会造成系统资源消耗,⽽且会影响到后续对⽂件的访问 。

1.2 文件操作案例-------读文件

# 打开文件
file = open(r"C:\Users\Administrator\Desktop\工单查询.txt", "r", encoding="utf8")
# 读取文件
text = file.read()
# 显示读取内容
print(text)
# 关闭文件
file.close()
注意:

在 python 中 ,字符串前面加 r,表示字符串的内容不通过\转义 ;

encoding="utf8" 以 utf8 编码格式打开文件 。

1.3 文件操作案例-------写文件

# 打开文件
file = open(r"C:\Users\Administrator\Desktop\Test.txt", "w")
# 写入内容
str1 = "求个关注+点赞\n"
file.write(str1)
# 关闭文件
file.close()

1.4 open 打开⽂件的⽅式

open 函数默认以只读⽅式打开⽂件,并且返回⽂件对象

  • “r”:只读方式打开文件;
  • “w”:只写方式打开文件;
  • “a”:追加写方式打开文件;

open 函数的访问方式后面添加 b 参数代表访问二进制文件

rb: 代表用只读的方式打开一个二进制文件;

wb:代表用只写的方式打开一个二进制文件。

ab:代表用追加写的方式打开一个二进制文件

2、按行读取

read ⽅法默认会把⽂件的所有内容⼀次性读取到内存 ,但是如果⽂件太⼤,对内存的占⽤会⾮常严重。

解决方案就是: 按行读取文件内容。

2.1 readline ⽅法

readline 方法可以一次读取一行内容,⽅法执⾏后,会把⽂件指针移动到下⼀⾏,准备再次读取readline 方法读取到文件最后,返回长度为 0 的字符串 ”” 。
# 打开文件
file = open(r"C:\Users\Administrator\Desktop\工单查询.txt", "r", encoding="utf8")
# 读取文件
text = file.readline()
# 显示读取内容
print(text)
# 关闭文件
file.close()

我们还可以结合 while 循环 readline 读取文件全部内容

# 打开文件
file = open(r"C:\Users\Administrator\Desktop\工单查询.txt", "r", encoding="utf8")
while True:
    # 读取文件
    text = file.readline()
    if text =="":
        break
    # 显示读取内容
    print(text,end="")
# 关闭文件
file.close()

2.2 readlines ⽅法

readlines 方法可以一次读取文件所有行,返回类型为列表。
# 打开文件
file = open(r"C:\Users\Administrator\Desktop\工单查询.txt", "r", encoding="utf8")
text = file.readlines()
for i in text:
    print(i,end="")
# 关闭文件
file.close()

2.3 with open 语法

with open(r"C:\Users\Administrator\Desktop\工单查询.txt", "r", encoding="utf8") as file:
    print(file.read())

3、JSON 操作

JSON 的全称是”JavaScript Object Notation”,是 JavaScript 对象表示法,它是一种基于文本,独立于语言的轻量级数据交换格式。

3.1 特点

  • JSON 是纯文本;
  • JSON 具有良好的自我描述性,便于阅读和编写;
  • JSON 具有清晰的层级结构;
  • 有效地提升网络传输效率;

3.2 语法规则

  • 大括号保存对象;
  • 中括号保存数组;
  • 对象数组可以相互嵌套;
  • 数据采用键值对表示;
  • 多个数据由逗号分隔;

3.3 值

  • 数字(整数或浮点数);
  • 字符串(在双引号中);
  • 逻辑值(true 或 false);
  • 数组(在中括号中);
  • 对象(在大括号中);
  • null

示例:

{
  "name" : "node-1",
  "cluster_name" : "elasticsearch",
  "cluster_uuid" : "rtFGtGA3QKqy3nnm4f33SA",
  "version" : {
    "number" : "7.3.0",
    "build_flavor" : "default",
    "build_type" : "zip",
    "build_hash" : "de777fa",
    "build_date" : "2019-07-24T18:30:11.767338Z",
    "build_snapshot" : false,
    "lucene_version" : "8.1.0",
    "minimum_wire_compatibility_version" : "6.8.0",
    "minimum_index_compatibility_version" : "6.0.0-beta1"
  },
  "tagline" : "You Know, for Search"
}

3.4 数据操作

读取json文件:

import json
# 打开文件
f = open(r"C:\Users\Administrator\Desktop\Test.json", "r", encoding="utf8")
data = json.load(f)
# 返回的 data 数据类型为字典或列表
print(data)
f.close()

写入json文件:

import json

# 准备数据
data = {'name': '一切总会归于平淡', 'age': 18, 'url': 'https://juejin.cn/user/567767899324286'}
# 打开文件
f = open(r"C:\Users\Administrator\Desktop\Test.json", "w", encoding='UTF-8')
json.dump(data, f, ensure_ascii=False)
f.close()

注:

ensure_ascii=False 代表中文不转义
相关文章
|
3月前
|
安全 关系型数据库 测试技术
学习Python Web开发的安全测试需要具备哪些知识?
学习Python Web开发的安全测试需要具备哪些知识?
121 61
|
1天前
|
存储 算法 API
【01】整体试验思路,如何在有UID的情况下获得用户手机号信息,python开发之理论研究试验,如何通过抖音视频下方的用户的UID获得抖音用户的手机号-本系列文章仅供学习研究-禁止用于任何商业用途-仅供学习交流-优雅草卓伊凡
【01】整体试验思路,如何在有UID的情况下获得用户手机号信息,python开发之理论研究试验,如何通过抖音视频下方的用户的UID获得抖音用户的手机号-本系列文章仅供学习研究-禁止用于任何商业用途-仅供学习交流-优雅草卓伊凡
109 82
|
3月前
|
机器学习/深度学习 Python
堆叠集成策略的原理、实现方法及Python应用。堆叠通过多层模型组合,先用不同基础模型生成预测,再用元学习器整合这些预测,提升模型性能
本文深入探讨了堆叠集成策略的原理、实现方法及Python应用。堆叠通过多层模型组合,先用不同基础模型生成预测,再用元学习器整合这些预测,提升模型性能。文章详细介绍了堆叠的实现步骤,包括数据准备、基础模型训练、新训练集构建及元学习器训练,并讨论了其优缺点。
168 3
|
2天前
|
Python
python pandas学习(一)
该代码段展示了四个主要操作:1) 删除指定列名,如商品id;2) 使用正则表达式模糊匹配并删除列,例如匹配订单商品名称1的列;3) 将毫秒级时间戳转换为带有时区调整的日期时间格式,并增加8小时以适应本地时区;4) 将列表转换为DataFrame后保存为Excel文件,文件路径和名称根据变量拼接而成。
16 3
|
2月前
|
Python 容器
Python学习的自我理解和想法(9)
这是我在B站跟随千锋教育学习Python的第9天,主要学习了赋值、浅拷贝和深拷贝的概念及其底层逻辑。由于开学时间紧张,内容较为简略,但希望能帮助理解这些重要概念。赋值是创建引用,浅拷贝创建新容器但元素仍引用原对象,深拷贝则创建完全独立的新对象。希望对大家有所帮助,欢迎讨论。
|
4月前
|
存储 Python
Python文件操作(1)
【10月更文挑战第17天】
Python文件操作(1)
|
2月前
|
Python
Python学习的自我理解和想法(10)
这是我在千锋教育B站课程学习Python的第10天笔记,主要学习了函数的相关知识。内容包括函数的定义、组成、命名、参数分类(必须参数、关键字参数、默认参数、不定长参数)及调用注意事项。由于开学时间有限,记录较为简略,望谅解。通过学习,我理解了函数可以封装常用功能,简化代码并便于维护。若有不当之处,欢迎指正。
|
1月前
|
数据可视化 数据挖掘 大数据
1.1 学习Python操作Excel的必要性
学习Python操作Excel在当今数据驱动的商业环境中至关重要。Python能处理大规模数据集,突破Excel行数限制;提供丰富的库实现复杂数据分析和自动化任务,显著提高效率。掌握这项技能不仅能提升个人能力,还能为企业带来价值,减少人为错误,提高决策效率。推荐从基础语法、Excel操作库开始学习,逐步进阶到数据可视化和自动化报表系统。通过实际项目巩固知识,关注新技术,为职业发展奠定坚实基础。
|
2月前
|
存储 索引 Python
Python学习的自我理解和想法(6)
这是我在B站千锋教育学习Python的第6天笔记,主要学习了字典的使用方法,包括字典的基本概念、访问、修改、添加、删除元素,以及获取字典信息、遍历字典和合并字典等内容。开学后时间有限,内容较为简略,敬请谅解。
|
2月前
|
存储 程序员 Python
Python学习的自我理解和想法(2)
今日学习Python第二天,重点掌握字符串操作。内容涵盖字符串介绍、切片、长度统计、子串计数、大小写转换及查找位置等。通过B站黑马程序员课程跟随老师实践,非原创代码,旨在巩固基础知识与技能。

热门文章

最新文章