【Python】csv与json,哪个才是你的数据之选?

简介: 【Python】csv与json,哪个才是你的数据之选?

882ef14b589f4addae0d0f97c7f0161a.png


一、写在前面✨


大家好!我是初心,希望我们一路走来能坚守初心!

今天跟大家分享的文章是 `` ,希望能帮助到大家!本篇文章收录于 初心Python从入门到精通 专栏。


🏠 个人主页:初心%个人主页

🧑 个人简介:大家好,我是初心,和大家共同努力

💕欢迎大家:这里是CSDN,我记录知识的地方,喜欢的话请三连,有问题请私信😘

💕 没有BUG的代码是不完美的!』—— Sodium_Sulfate「Sodium_Sulfate」


二、读写csv文件


2.1 什么是CSV文件


CSV(Comma-Separated Values,逗号分隔的值)是一种简单、实用的文件格式,用于存储和表示包括文本、数值等各种类型的数据。


CSV 文件通常以 .csv 作为文件扩展名。这种文件格式的一个显著特点是:文件内的数据以逗号 , 分隔,呈现一个表格形式。CSV 文件已广泛应用于存储、传输和编辑数据。


2.2 csv文件的优点


1.简单易懂:CSV 文件基于纯文本格式,因此可以使用任何文本编辑器(如Notepad)轻松打开和编辑。

2.数据兼容性:CSV 文件中的数据可以很容易地跨平台进行传输和处理,任何具有 CSV 处理功能的软件(如Microsoft Excel、Google Sheets、甚至编程语言库)都能处理该类型的文件。

3.资源占用低:CSV 文件以纯文本形式存储数据,其体积相对较小,便于节省存储空间。


2.3 应用

下面请看具体的例子:

编程要求:按注释要求完成下列文件读写操作。

import re
import csv
def normalize(lines):
    return [line.replace('\t', '    ') for line in lines]
def read_file(file_path):
    """
    读取文本文件内容,并返回所有行的列表
    >>> normalize(read_file('test.txt'))
    ['学号    出生年月    政治面貌    民族    考生类别', '0001    2003/2/23    共青团员    汉族    城镇应届', '0002    2002/4/18    共青团员    汉族    农村应届']
    """
def write_file(file_path, lines):
    """
    将指定的行写入 CSV 文件中
    >>> write_file('output.csv', read_file('test.txt'))
    >>> read_file('output.csv')
    ['学号,出生年月,政治面貌,民族,考生类别', '0001,2003/2/23,共青团员,汉族,城镇应届', '0002,2002/4/18,共青团员,汉族,农村应届']
    """
import doctest
doctest.testmod()

具体实现:

def read_file(file_path):
    """
    读取文本文件内容,并返回所有行的列表
    >>> normalize(read_file('test.txt'))
    ['学号    出生年月    政治面貌    民族    考生类别', '0001    2003/2/23    共青团员    汉族    城镇应届', '0002    2002/4/18    共青团员    汉族    农村应届']
    """
    file_data = []
    with open(file_path, encoding='utf-8') as f:
        for i in f:
            file_data.append(i.strip())
    return file_data
def write_file(file_path, lines):
    """
    将指定的行写入 CSV 文件中
    >>> write_file('output.csv', read_file('test.txt'))
    >>> read_file('output.csv')
    ['学号,出生年月,政治面貌,民族,考生类别', '0001,2003/2/23,共青团员,汉族,城镇应届', '0002,2002/4/18,共青团员,汉族,农村应届']
    """
    with open(file_path, 'w', encoding='utf-8', newline='') as f:
        writer = csv.writer(f)
        for line in lines:
            writer.writerow(line.split('\t'))  # 使用 split() 将line变成列表



三、读取json文件

3.1 json介绍


json的全称为:JavaScript Object Notation,是一种轻量级的数据交互格式。它基于 ECMAScript (欧洲计算机协会制定的js规范)的一个子集,采用完全独立于编程语言的文本格式来存储和表示数据。


简单来说:json就是一种在各个编程语言中流通的数据格式,负责不同编程语言中的数据传递和交互。


3.2 例题

import json
def read_future_weather(filepath):
    """
    >>> read_future_weather("weather.json")
    ['小雨转多云', '多云转阴', '多云', '小雨转多云', '多云转小雨']
    >>> read_future_weather("test.txt")
    Error: not json file!
    """
  # Edit Your Code Here
import doctest
doctest.testmod()


具体实现:

json_data = {}
with open(filepath, 'r', encoding='utf-8') as f:
    try:
        json_data = json.load(f)  # 读取到 json 数据
    except ValueError:
        print('Error: not json file!')
        return None
future_list = json_data.get("result").get('future')
weather_list = []
for i in future_list:
    weather_list.append(i.get('weather'))
return weather_list


四、总结撒花😊


本文主要讲解了Python中如何使用csv文件和json文件,希望能帮助到大家。😊

这就是今天要分享给大家的全部内容了,我们下期再见!😊

🏠 本文由初心原创,首发于CSDN博客, 博客主页:初心%🏠

🏠 我在CSDN等你哦!😍


相关文章
|
3天前
|
数据处理 Python
如何使用Python的Pandas库进行数据排序和排名
【4月更文挑战第22天】Pandas Python库提供数据排序和排名功能。使用`sort_values()`按列进行升序或降序排序,如`df.sort_values(by='A', ascending=False)`。`rank()`函数用于计算排名,如`df['A'].rank(ascending=False)`。多列操作可传入列名列表,如`df.sort_values(by=['A', 'B'], ascending=[True, False])`和分别对'A'、'B'列排名。
14 2
|
3天前
|
机器学习/深度学习 算法 数据挖掘
PYTHON银行机器学习:回归、随机森林、KNN近邻、决策树、高斯朴素贝叶斯、支持向量机SVM分析营销活动数据|数据分享-2
PYTHON银行机器学习:回归、随机森林、KNN近邻、决策树、高斯朴素贝叶斯、支持向量机SVM分析营销活动数据|数据分享
24 1
|
2天前
|
机器学习/深度学习 算法 Python
数据分享|Python决策树、随机森林、朴素贝叶斯、KNN(K-最近邻居)分类分析银行拉新活动挖掘潜在贷款客户
数据分享|Python决策树、随机森林、朴素贝叶斯、KNN(K-最近邻居)分类分析银行拉新活动挖掘潜在贷款客户
20 4
|
2天前
|
机器学习/深度学习 算法 算法框架/工具
数据分享|PYTHON用KERAS的LSTM神经网络进行时间序列预测天然气价格例子
数据分享|PYTHON用KERAS的LSTM神经网络进行时间序列预测天然气价格例子
22 0
|
2天前
|
机器学习/深度学习 数据挖掘 网络架构
Python对商店数据进行lstm和xgboost销售量时间序列建模预测分析
Python对商店数据进行lstm和xgboost销售量时间序列建模预测分析
14 0
|
2天前
|
数据挖掘 数据处理 索引
如何使用Python的Pandas库进行数据筛选和过滤?
Pandas是Python数据分析的核心库,提供DataFrame数据结构。基本步骤包括导入库、创建DataFrame及进行数据筛选。示例代码展示了如何通过布尔索引、`query()`和`loc[]`方法筛选`Age`大于19的记录。
10 0
|
4天前
|
Python
如何使用Python的Pandas库进行数据缺失值处理?
Pandas在Python中提供多种处理缺失值的方法:1) 使用`isnull()`检查;2) `dropna()`删除含缺失值的行或列;3) `fillna()`用常数、前后值填充;4) `interpolate()`进行插值填充。根据需求选择合适的方法处理数据缺失。
38 9
|
6天前
|
索引 Python
如何使用Python的Pandas库进行数据透视表(pivot table)操作?
使用Pandas在Python中创建数据透视表的步骤包括:安装Pandas库,导入它,创建或读取数据(如DataFrame),使用`pd.pivot_table()`指定数据框、行索引、列索引和值,计算聚合函数(如平均分),并可打印或保存结果到文件。这允许对数据进行高效汇总和分析。
10 2
|
7天前
|
JSON 关系型数据库 数据库
《Python 简易速速上手小册》第6章:Python 文件和数据持久化(2024 最新版)
《Python 简易速速上手小册》第6章:Python 文件和数据持久化(2024 最新版)
34 0
|
8天前
|
机器学习/深度学习 Python 数据处理
Python中利用长短期记忆模型LSTM进行时间序列预测分析 - 预测电力负荷数据
Python中利用长短期记忆模型LSTM进行时间序列预测分析 - 预测电力负荷数据
33 0
Python中利用长短期记忆模型LSTM进行时间序列预测分析 - 预测电力负荷数据