Python csv、xlsx、json、二进制(MP3) 文件读写基本使用

简介: “流”是一种抽象的概念,也是一种比喻,水流是从—端流向另一端的,而在python中的“水流"就是数据,数据会从一端"流向”另一端,根据流的方向性,我们可以将流分为输入流和输出流,当程序需要从数据源中读入数据的时候就会开启一个输入流,相反,写出数据也会开启一个输出流,需要写入的数据源可以是文件、内存或者网络等。

Python csv、xlsx、json、二进制(MP3) 文件读写基本使用

文章目录

前言

一、什么是文件读写?

二、文件读写方式

三、csv文件读写

1.csv 简介

2.csv 写入

3.csv 读入

四、XLSX文件读写

1.xlsx 简介

2.xlsx 写入

3.xlsx 读入

五、JSON文件读写

1.json 简介

2.json 写入

3.json 读取

六、二进制(MP3)写入

1.二进制 简介

2.二进制(MP3) 写入

3.二进制(MP3) 读入

总结

前言


提示:以下是本篇文章正文内容,下面案例可供参考

一、什么是文件读写?

“流”是一种抽象的概念,也是一种比喻,水流是从—端流向另一端的,而在python中的“水流"就是数据,数据会从一端"流向”另一端,根据流的方向性,我们可以将流分为输入流和输出流,当程序需要从数据源中读入数据的时候就会开启一个输入流,相反,写出数据也会开启一个输出流,需要写入的数据源可以是文件、内存或者网络等。

二、文件读写方式

读取方式 描述
r 只读(默认),文件需存在;
r+ 可读取也可以写入,文件需存在;
rb 表示以二进制方式读取文件,文件需存在;
w 只写,打开一个新文件写入,如果该文件存在则会覆盖;
w+ 可读取也可以写入,打开创建新文件并写入数据,如果文件已存在,则覆盖;
wb 二进制写入,打开一个新文件写入,如果该文件存在则会覆盖;
a 追加写入,文件需存在,在文件内容结尾处继续写入新内容;
a+ 追加写入,文件不存在则会创建一个新文件,在文件内容结尾处继续写入新内容;

三、csv文件读写

1.csv 简介

CSV文件通常使用逗号来分割每个特定数据值(也可用’: ::’,’; ;;'等),具体的文件结构如下:

2.csv 写入

file_path = "number.csv"
content_list = ['1,2,3,4,5\n', '6,7,8,9,10\n', '11,12,13,14,15\n', '16,17,18,19,20\n']
with open(file=file_path, mode='w', encoding='utf-8') as fis:
    for content in content_list:
        fis.write(content)
        print(f"写入成功:{content}", end='')

控制台打印
csv文件内容

3.csv 读入

file_path = "number.csv"
with open(file=file_path, mode='r', encoding='utf-8') as fis:
    content_list = fis.readlines()
for content in content_list:
    print(f"读入成功:{content}", end='')
    print(content.strip())

控制台打印

四、XLSX文件读写

1.xlsx 简介

xlsx是Microsoft Office EXCEL 2007/2010/2013/2016/2019文档的扩展名。其基于Office Open XML标准的压缩文件格式取代了其以前专有的默认文件格式,在传统的文件名扩展名后面添加了字母“x”(即“.docx”取代“.doc”、“.xlsx”取代“.xls”、“.pptx”取代“.ppt”)。任何能够打开“.xlsx”文件的文字处理软件都可以将该文档转换为“.xls”文件,“.xlsx”文件比“.xls”文件所占用空间更小

2.xlsx 写入

import pandas as pd
file_path = 'number.xlsx'
data_list = pd.DataFrame(columns=('A', 'B', 'C', 'D', 'E'))  # pandas Version: 1.1.3
content_list = [['1', '2', '3', '4', '5\n'], ['6', '7', '8', '9', '10\n'], ['11', '12', '13', '14', '15\n']]
for ls in content_list:
    result_list = data_list.append(pd.DataFrame(
        {
            'A': [ls[0]], 'B': [ls[1]], 'C': [ls[2]], 'D': [ls[3]], 'E': [ls[4]]
        }
    ))
    print(f"存入成功:{ls}")
with pd.ExcelWriter(file_path, engine="openpyxl", mode='a+') as writer:  # openpyxl Version: 3.0.10
    data_list.to_excel(writer, sheet_name='sheet1', index=False)
print("数据写入成功!")

控制台打印
在这里插入图片描述

3.xlsx 读入

import pandas as pd
file_path = 'number.xlsx'
df = pd.read_excel(io=file_path, sheet_name=0)
a_list = list(df['A'])  # 按列提取,根据列名,得到list
print('a_list:', a_list)
for index, row in df.iterrows():  # index = 行标号(索引)
    print(row)  # 按行遍历
    print(f"row['A']: {row['A']}")  # 根据列名在当前行提取值
    break

控制台输出
注意报错信息:ImportError: Missing optional dependency 'xlrd'. Install xlrd >= 1.0.0 for Excel support Use pip or conda to install xlrd.
需要安装库:pip install xlrd==1.2.0 -i https://pypi.tuna.tsinghua.edu.cn/simple
pandas常用方法:https://www.lmlphp.com/user/60946/article/item/2367333/

五、JSON文件读写

1.json 简介

JSON(JavaScript Object Notation, JS对象简谱)是一种轻量级的数据交换格式。它基于 ECMAScript(European Computer Manufacturers Association, 欧洲计算机协会制定的js规范)的一个子集,采用完全独立于编程语言的文本格式来存储和表示数据。简洁和清晰的层次结构使得 JSON 成为理想的数据交换语言。 易于人阅读和编写,同时也易于机器解析和生成,并有效地提升网络传输效率。

2.json 写入

import json
from pprint import pprint
file_path = 'number.json'
content_list = [['1', '2', '3', '4', '5'], ['6', '7', '8', '9', '10'], ['11', '12', '13', '14', '15']]
key_list = ['A', 'B', 'C']
data = dict()
for i in range(len(content_list)):
    data[key_list[i]] = content_list[i]
with open(file=file_path, mode='w', encoding='utf-8') as fis:
    fis.write(json.dumps(obj=data, ensure_ascii=False, indent=4))
pprint(data)
print("json数据写入完成")

控制台打印
json文件内容

3.json 读取

import json
from pprint import pprint
file_path = 'number.json'
with open(file=file_path, mode='r', encoding='utf-8') as fis:
    content = fis.read()
json_data = json.loads(content)  # 序列化之后可以根据字典方式存取数据
json_data['D'] = ['16', '17', '18', '19', '20']
pprint(json_data)

控制台输出

六、二进制(MP3)写入

1.二进制 简介

二进制(binary),发现者莱布尼茨,是在数学和数字电路中以2为基数的记数系统,是以2为基数代表系统的二进位制。这一系统中,通常用两个不同的符号0(代表零)和1(代表一)来表示 [1] 。数字电子电路中,逻辑门的实现直接应用了二进制,现代的计算机和依赖计算机的设备里都使用二进制。每个数字称为一个比特(Bit,Binary digit的缩写)

2.二进制(MP3) 写入

import requests
file_path = 'test.mp3'
headers = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/106.0.0.0 Safari/537.36'
}
url = 'https://m701.music.126.net/20221023111433/7c8defd5c895b331c9df055e99619652/jdyyaac/obj/w5rDlsOJwrLDjj7CmsOj/7385120648/b9ed/2e3d/169a/941c017bebc80041b787542396dab922.m4a'
response = requests.get(url=url, headers=headers)
with open(file_path, 'wb') as fis:
    for chunk in response.iter_content(chunk_size=1000):
        fis.write(chunk)
        fis.flush()
print("歌曲下载完成!")

下载文件mp3
开始听歌

3.二进制(MP3) 读入

file_path = 'test.mp3'
with open(file_path, 'rb') as fis:
    content = fis.read()

总结

例如:以上就是今天要讲的内容,本文仅仅简单介绍了文件的读写使用,后续有常用的读取操作会在这篇博客中持续更新;

目录
相关文章
|
11天前
|
机器学习/深度学习 存储 算法
解锁文件共享软件背后基于 Python 的二叉搜索树算法密码
文件共享软件在数字化时代扮演着连接全球用户、促进知识与数据交流的重要角色。二叉搜索树作为一种高效的数据结构,通过有序存储和快速检索文件,极大提升了文件共享平台的性能。它依据文件名或时间戳等关键属性排序,支持高效插入、删除和查找操作,显著优化用户体验。本文还展示了用Python实现的简单二叉搜索树代码,帮助理解其工作原理,并展望了该算法在分布式计算和机器学习领域的未来应用前景。
|
17天前
|
开发工具 git 索引
怎么取消对project.private.config.json这个文件的git记录
通过以上步骤,您可以成功取消对 `project.private.config.json`文件的Git记录。这样,文件将不会被包含在未来的提交中,同时仍保留在您的工作区中。
58 28
|
21天前
|
监控 网络安全 开发者
Python中的Paramiko与FTP文件夹及文件检测技巧
通过使用 Paramiko 和 FTP 库,开发者可以方便地检测远程服务器上的文件和文件夹是否存在。Paramiko 提供了通过 SSH 协议进行远程文件管理的能力,而 `ftplib` 则提供了通过 FTP 协议进行文件传输和管理的功能。通过理解和应用这些工具,您可以更加高效地管理和监控远程服务器上的文件系统。
51 20
|
27天前
|
存储 数据采集 数据处理
如何在Python中高效地读写大型文件?
大家好,我是V哥。上一篇介绍了Python文件读写操作,今天聊聊如何高效处理大型文件。主要方法包括:逐行读取、分块读取、内存映射(mmap)、pandas分块处理CSV、numpy处理二进制文件、itertools迭代处理及linecache逐行读取。这些方法能有效节省内存,提升效率。关注威哥爱编程,学习更多Python技巧。
|
28天前
|
存储 JSON 对象存储
如何使用 Python 进行文件读写操作?
大家好,我是V哥。本文介绍Python中文件读写操作的方法,包括文件读取、写入、追加、二进制模式、JSON、CSV和Pandas模块的使用,以及对象序列化与反序列化。通过这些方法,你可以根据不同的文件类型和需求,灵活选择合适的方式进行操作。希望对正在学习Python的小伙伴们有所帮助。欢迎关注威哥爱编程,全栈路上我们并肩前行。
|
1月前
|
存储 算法 Serverless
剖析文件共享工具背后的Python哈希表算法奥秘
在数字化时代,文件共享工具不可或缺。哈希表算法通过将文件名或哈希值映射到存储位置,实现快速检索与高效管理。Python中的哈希表可用于创建简易文件索引,支持快速插入和查找文件路径。哈希表不仅提升了文件定位速度,还优化了存储管理和多节点数据一致性,确保文件共享工具高效运行,满足多用户并发需求,推动文件共享领域向更高效、便捷的方向发展。
|
2月前
|
计算机视觉 Python
如何使用Python将TS文件转换为MP4
本文介绍了如何使用Python和FFmpeg将TS文件转换为MP4文件。首先需要安装Python和FFmpeg,然后通过`subprocess`模块调用FFmpeg命令,实现文件格式的转换。代码示例展示了具体的操作步骤,包括检查文件存在性、构建FFmpeg命令和执行转换过程。
76 7
|
3月前
|
中间件 Docker Python
【Azure Function】FTP上传了Python Function文件后,无法在门户页面加载函数的问题
通过FTP上传Python Function至Azure云后,出现函数列表无法加载的问题。经排查,发现是由于`requirements.txt`中的依赖包未被正确安装。解决方法为:在本地安装依赖包到`.python_packages/lib/site-packages`目录,再将该目录内容上传至云上的`wwwroot`目录,并重启应用。最终成功加载函数列表。
|
3月前
|
JSON 数据格式 索引
Python中序列化/反序列化JSON格式的数据
【11月更文挑战第4天】本文介绍了 Python 中使用 `json` 模块进行序列化和反序列化的操作。序列化是指将 Python 对象(如字典、列表)转换为 JSON 字符串,主要使用 `json.dumps` 方法。示例包括基本的字典和列表序列化,以及自定义类的序列化。反序列化则是将 JSON 字符串转换回 Python 对象,使用 `json.loads` 方法。文中还提供了具体的代码示例,展示了如何处理不同类型的 Python 对象。
|
3月前
|
开发者 Python
Python中__init__.py文件的作用
`__init__.py`文件在Python包管理中扮演着重要角色,通过标识目录为包、初始化包、控制导入行为、支持递归包结构以及定义包的命名空间,`__init__.py`文件为组织和管理Python代码提供了强大支持。理解并正确使用 `__init__.py`文件,可以帮助开发者更好地组织代码,提高代码的可维护性和可读性。
178 2

热门文章

最新文章

推荐镜像

更多