数据导入与预处理-第4章-Python标准库之json

简介: 数据导入与预处理-第4章-Python标准库之json

资源


参考:https://zhuanlan.zhihu.com/p/436465279

https://blog.csdn.net/impoijimlq/article/details/130445399


json概述


什么是json


json是一种轻量级的文本数据

交换格式json独立于其他语言

json具有自我描述性,更好理解

json比xml更小、更快,更容易解析


json格式

{
    "name":"lhh",
    "age":"20"
}


json标准库的作用


使用json字符串生成python对象(load)

由python对象格式成为json字符串(dump)


数据的类型转换


将数据从python转换到json格式,在数据类型上会有什么变化呢,如下表所示:


Python JSON
dict object
list,tuple array
str string
int,float,int- number
True true
False false
None null


使用方式


方法 功能
json.dump(obj,fp) 将python数据类型转换并保存到json格式的文件内
json.dumps(obj) 将python数据类型转换为json格式的字符串
json.load(obj) 将json格式的文件中读取数据并转换为python类型
json.loads(s) 将json格式的字符串转换为python的类型


json案例


dumps案例

import json
#从python对象格式化一个json  string
person = {"name":"张某某","gender":"man","age":25}
print(person)
#转换为json字符串
jsonStr = json.dumps(person,)
print(jsonStr)
#转换为json字符串 中文编码避免
jsonStr = json.dumps(person,ensure_ascii=False)
print(jsonStr)

输出为:

57eb1b7425f2e7dc2080e8296df10c89_224db3ba38574670b159d9e09271fc08.png


在python中定义json的时候,可以使用单引号,也可以使用双引号。但是最后在输出的时候,输出的是一个单引号,以字典的方式进行输出的。

我们进行json格式转换之后,我们就会变成一个标准的json格式的字符串,即双引号修饰的字符串

对于包含中文的内容,会被转码为\u开头,这时可以通过ensure_ascii=False完成中文输出。json_dumps(dict)时,如果dict包含有汉字,一定加上ensure_ascii=False。否则按参数默认值True,意思是保证dumps之后的结果里所有的字符都能够被ascii表示,汉字在ascii的字符集里面,因此经过dumps以后的str里,汉字会变成对应的unicode。


dump案例


中文编码问题

import json
#从python对象格式化一个json  string
person = {"name":"张某某","gender":"man","age":25}
print(person)
#转换为json文件
json.dump(person,open("data.json","w"))
#转换为json文件,文件内容为中文  
json.dump(person,open("data1.json","w",encoding="utf-8"),ensure_ascii=False)

输出为:

884dc3a4b4d8ed4c5a2958a977ef8ac0_fdbbc8a3a3e143249880250355558e95.png


格式化问题

import json
#从python对象格式化一个json  string
person = {"name":"张某某","gender":"man","age":25}
print(person)
#转换为json文件
json.dump(person,open("data.json","w"))
#转换为json文件,文件内容为中文  
json.dump(person,
          open("data1.json","w",encoding="utf-8"),
          ensure_ascii=False,
          indent=4)

输出为:

68181e9c7a3c7f2970a5a07e85ce6746_88babed13d8f46848391ce77e4c54200.png


import json
#从python对象格式化一个json  string
person = {"name":"张某某","gender":"man","age":25}
print(person)
#转换为json文件,文件内容为中文  
json.dump(person,
          open("data1.json","w",encoding="utf-8"),
          ensure_ascii=False,
          indent=4,
          sort_keys=True)

输出为:

71f257fe44061b41284bb19863286060_360aeee42dff463c961f62f03d20c18c.png


loads案例


import json
data = {'name':'张某某','gender':'man','age':18}
# 将Python对象编码成json字符串
# print(json.dumps(data))
# 将json字符串解码成Python对象
a = json.dumps(data)
print(json.loads(a))
print('+'*10)
data = (1,2,3,4)
data_json = [1,2,3,4]
#将Python对象编码成json字符串
print(json.dumps(data))
print(json.dumps(data_json))
print('+'*10)
#将Python对象编码成json字符串
a = json.dumps(data)
b = json.dumps(data_json)
print('+'*10)
#将json字符串编码成Python对象
print(json.loads(a))
print(json.loads(b))

输出为

56c0b2229c99b8a4edb7e644ff3fbec2_c1f10d7550d04699963ff118ef57019c.png


load案例

相关文章
|
4天前
|
Python
在Python中绘制K线图,可以使用matplotlib和mplfinance库
使用Python的matplotlib和mplfinance库可绘制金融K线图。mplfinance提供便利的绘图功能,示例代码显示如何加载CSV数据(含开盘、最高、最低、收盘价及成交量),并用`mpf.plot()`绘制K线图,设置类型为'candle',显示移动平均线(mav)和成交量信息。可通过调整参数自定义图表样式,详情参考mplfinance文档。
14 2
|
4天前
|
机器学习/深度学习 边缘计算 TensorFlow
【Python机器学习专栏】Python机器学习工具与库的未来展望
【4月更文挑战第30天】本文探讨了Python在机器学习中的关键角色,重点介绍了Scikit-learn、TensorFlow和PyTorch等流行库。随着技术进步,未来Python机器学习工具将聚焦自动化、智能化、可解释性和可信赖性,并促进跨领域创新,结合云端与边缘计算,为各领域应用带来更高效、可靠的解决方案。
|
4天前
|
机器学习/深度学习 计算机视觉 Python
【Python 机器学习专栏】图像数据的特征提取与预处理
【4月更文挑战第30天】本文探讨了图像数据的特征提取与预处理在机器学习中的重要性。图像数据具有大容量、信息丰富和冗余性高的特点。特征提取涉及颜色、纹理和形状特征;预处理包括图像增强、去噪和分割。Python的OpenCV和Scikit-image库在处理这些任务时非常有用。常见的特征提取方法有统计、变换和基于模型的方法,而预处理应注意保持图像真实性、适应性调整及验证评估。有效的特征提取和预处理能提升模型性能,Python工具使其更高效。
|
4天前
|
数据采集 机器学习/深度学习 存储
【Python 机器学习专栏】Python 数据清洗与预处理技巧
【4月更文挑战第30天】在数据驱动的时代,数据清洗与预处理对机器学习模型的性能至关重要。Python凭借其强大的工具,如Pandas和Scikit-learn,成为数据处理的理想选择。本文聚焦Python中的数据清洗技巧:处理缺失值(填充或删除)、异常值识别与修正、重复数据删除。同时,讨论了数据预处理的标准化、归一化、特征选择和特征工程。强调了结合业务需求、数据验证及备份的重要性,指出有效数据清洗与预处理是提升模型性能的基础。
|
5天前
|
Serverless Python
使用Python的pandas和matplotlib库绘制移动平均线(MA)示例
使用Python的pandas和matplotlib库绘制移动平均线(MA)示例:加载CSV数据,计算5日、10日和20日MA,然后在K线图上绘制。通过`rolling()`计算平均值,`plot()`函数展示图表,`legend()`添加图例。可利用matplotlib参数自定义样式。查阅matplotlib文档以获取更多定制选项。
15 1
|
5天前
|
数据采集 SQL 数据挖掘
Python数据分析中的Pandas库应用指南
在数据科学和分析领域,Python语言已经成为了一种非常流行的工具。本文将介绍Python中的Pandas库,该库提供了强大的数据结构和数据分析工具,使得数据处理变得更加简单高效。通过详细的示例和应用指南,读者将了解到如何使用Pandas库进行数据加载、清洗、转换和分析,从而提升数据处理的效率和准确性。
|
5天前
|
SQL 关系型数据库 MySQL
使用Python的pymysql库连接MySQL,执行CRUD操作
使用Python的pymysql库连接MySQL,执行CRUD操作:安装pymysql,然后连接(host='localhost',user='root',password='yourpassword',database='yourdatabase'),创建游标。查询数据示例:`SELECT * FROM yourtable`;插入数据:`INSERT INTO yourtable...`;更新数据:`UPDATE yourtable SET...`;删除数据:`DELETE FROM yourtable WHERE...`。
12 0
|
5天前
|
JSON 数据格式 Python
Python标准库中包含了json模块,可以帮助你轻松处理JSON数据
【4月更文挑战第30天】Python的json模块简化了JSON数据与Python对象之间的转换。使用`json.dumps()`可将字典转为JSON字符串,如`{"name": "John", "age": 30, "city": "New York"}`,而`json.loads()`则能将JSON字符串转回字典。通过`json.load()`从文件读取JSON数据,`json.dump()`则用于将数据写入文件。
11 1
|
5天前
|
JSON 数据格式 Python
Python处理JSON数据
【4月更文挑战第30天】该内容介绍了Python处理JSON数据的三个方法:1)使用`json.loads()`尝试解析字符串以验证其是否为有效JSON,通过捕获`JSONDecodeError`异常判断有效性;2)通过`json.dumps()`的`indent`参数格式化输出JSON数据,使其更易读;3)处理JSON中的日期,利用`dateutil`库将日期转换为字符串进行序列化和反序列化。
15 4
|
5天前
|
机器学习/深度学习 算法 数据挖掘
机器学习--K近邻算法,以及python中通过Scikit-learn库实现K近邻算法API使用技巧
机器学习--K近邻算法,以及python中通过Scikit-learn库实现K近邻算法API使用技巧