数据导入与预处理-第4章-Python标准库之json

简介: 数据导入与预处理-第4章-Python标准库之json

资源


参考:https://zhuanlan.zhihu.com/p/436465279

https://blog.csdn.net/impoijimlq/article/details/130445399


json概述


什么是json


json是一种轻量级的文本数据

交换格式json独立于其他语言

json具有自我描述性,更好理解

json比xml更小、更快,更容易解析


json格式

{
    "name":"lhh",
    "age":"20"
}


json标准库的作用


使用json字符串生成python对象(load)

由python对象格式成为json字符串(dump)


数据的类型转换


将数据从python转换到json格式,在数据类型上会有什么变化呢,如下表所示:


Python JSON
dict object
list,tuple array
str string
int,float,int- number
True true
False false
None null


使用方式


方法 功能
json.dump(obj,fp) 将python数据类型转换并保存到json格式的文件内
json.dumps(obj) 将python数据类型转换为json格式的字符串
json.load(obj) 将json格式的文件中读取数据并转换为python类型
json.loads(s) 将json格式的字符串转换为python的类型


json案例


dumps案例

import json
#从python对象格式化一个json  string
person = {"name":"张某某","gender":"man","age":25}
print(person)
#转换为json字符串
jsonStr = json.dumps(person,)
print(jsonStr)
#转换为json字符串 中文编码避免
jsonStr = json.dumps(person,ensure_ascii=False)
print(jsonStr)

输出为:

57eb1b7425f2e7dc2080e8296df10c89_224db3ba38574670b159d9e09271fc08.png


在python中定义json的时候,可以使用单引号,也可以使用双引号。但是最后在输出的时候,输出的是一个单引号,以字典的方式进行输出的。

我们进行json格式转换之后,我们就会变成一个标准的json格式的字符串,即双引号修饰的字符串

对于包含中文的内容,会被转码为\u开头,这时可以通过ensure_ascii=False完成中文输出。json_dumps(dict)时,如果dict包含有汉字,一定加上ensure_ascii=False。否则按参数默认值True,意思是保证dumps之后的结果里所有的字符都能够被ascii表示,汉字在ascii的字符集里面,因此经过dumps以后的str里,汉字会变成对应的unicode。


dump案例


中文编码问题

import json
#从python对象格式化一个json  string
person = {"name":"张某某","gender":"man","age":25}
print(person)
#转换为json文件
json.dump(person,open("data.json","w"))
#转换为json文件,文件内容为中文  
json.dump(person,open("data1.json","w",encoding="utf-8"),ensure_ascii=False)

输出为:

884dc3a4b4d8ed4c5a2958a977ef8ac0_fdbbc8a3a3e143249880250355558e95.png


格式化问题

import json
#从python对象格式化一个json  string
person = {"name":"张某某","gender":"man","age":25}
print(person)
#转换为json文件
json.dump(person,open("data.json","w"))
#转换为json文件,文件内容为中文  
json.dump(person,
          open("data1.json","w",encoding="utf-8"),
          ensure_ascii=False,
          indent=4)

输出为:

68181e9c7a3c7f2970a5a07e85ce6746_88babed13d8f46848391ce77e4c54200.png


import json
#从python对象格式化一个json  string
person = {"name":"张某某","gender":"man","age":25}
print(person)
#转换为json文件,文件内容为中文  
json.dump(person,
          open("data1.json","w",encoding="utf-8"),
          ensure_ascii=False,
          indent=4,
          sort_keys=True)

输出为:

71f257fe44061b41284bb19863286060_360aeee42dff463c961f62f03d20c18c.png


loads案例


import json
data = {'name':'张某某','gender':'man','age':18}
# 将Python对象编码成json字符串
# print(json.dumps(data))
# 将json字符串解码成Python对象
a = json.dumps(data)
print(json.loads(a))
print('+'*10)
data = (1,2,3,4)
data_json = [1,2,3,4]
#将Python对象编码成json字符串
print(json.dumps(data))
print(json.dumps(data_json))
print('+'*10)
#将Python对象编码成json字符串
a = json.dumps(data)
b = json.dumps(data_json)
print('+'*10)
#将json字符串编码成Python对象
print(json.loads(a))
print(json.loads(b))

输出为

56c0b2229c99b8a4edb7e644ff3fbec2_c1f10d7550d04699963ff118ef57019c.png


load案例

相关文章
|
8月前
|
数据采集 Web App开发 数据可视化
Python零基础爬取东方财富网股票行情数据指南
东方财富网数据稳定、反爬宽松,适合爬虫入门。本文详解使用Python抓取股票行情数据,涵盖请求发送、HTML解析、动态加载处理、代理IP切换及数据可视化,助你快速掌握金融数据爬取技能。
6639 1
|
8月前
|
Java 数据挖掘 数据处理
(Pandas)Python做数据处理必选框架之一!(一):介绍Pandas中的两个数据结构;刨析Series:如何访问数据;数据去重、取众数、总和、标准差、方差、平均值等;判断缺失值、获取索引...
Pandas 是一个开源的数据分析和数据处理库,它是基于 Python 编程语言的。 Pandas 提供了易于使用的数据结构和数据分析工具,特别适用于处理结构化数据,如表格型数据(类似于Excel表格)。 Pandas 是数据科学和分析领域中常用的工具之一,它使得用户能够轻松地从各种数据源中导入数据,并对数据进行高效的操作和分析。 Pandas 主要引入了两种新的数据结构:Series 和 DataFrame。
716 0
|
8月前
|
JSON API 数据格式
淘宝拍立淘按图搜索API系列,json数据返回
淘宝拍立淘按图搜索API系列通过图像识别技术实现商品搜索功能,调用后返回的JSON数据包含商品标题、图片链接、价格、销量、相似度评分等核心字段,支持分页和详细商品信息展示。以下是该API接口返回的JSON数据示例及详细解析:
|
8月前
|
JSON 算法 API
Python采集淘宝商品评论API接口及JSON数据返回全程指南
Python采集淘宝商品评论API接口及JSON数据返回全程指南
|
8月前
|
JSON API 数据安全/隐私保护
Python采集淘宝拍立淘按图搜索API接口及JSON数据返回全流程指南
通过以上流程,可实现淘宝拍立淘按图搜索的完整调用链路,并获取结构化的JSON商品数据,支撑电商比价、智能推荐等业务场景。
|
8月前
|
JSON 算法 API
Python中的json模块:从基础到进阶的实用指南
本文深入解析Python内置json模块的使用,涵盖序列化与反序列化核心函数、参数配置、中文处理、自定义对象转换及异常处理,并介绍性能优化与第三方库扩展,助你高效实现JSON数据交互。(238字)
672 4
|
8月前
|
JSON 中间件 Java
【GoGin】(3)Gin的数据渲染和中间件的使用:数据渲染、返回JSON、浅.JSON()源码、中间件、Next()方法
我们在正常注册中间件时,会打断原有的运行流程,但是你可以在中间件函数内部添加Next()方法,这样可以让原有的运行流程继续执行,当原有的运行流程结束后再回来执行中间件内部的内容。​ c.Writer.WriteHeaderNow()还会写入文本流中。可以看到使用next后,正常执行流程中并没有获得到中间件设置的值。接口还提供了一个可以修改ContentType的方法。判断了传入的状态码是否符合正确的状态码,并返回。在内部封装时,只是标注了不同的render类型。再看一下其他返回的类型;
384 3
|
8月前
|
JSON Java Go
【GoGin】(2)数据解析和绑定:结构体分析,包括JSON解析、form解析、URL解析,区分绑定的Bind方法
bind或bindXXX函数(后文中我们统一都叫bind函数)的作用就是将,以方便后续业务逻辑的处理。
469 3
|
9月前
|
数据采集 关系型数据库 MySQL
python爬取数据存入数据库
Python爬虫结合Scrapy与SQLAlchemy,实现高效数据采集并存入MySQL/PostgreSQL/SQLite。通过ORM映射、连接池优化与批量提交,支持百万级数据高速写入,具备良好的可扩展性与稳定性。
|
9月前
|
JSON API 数据安全/隐私保护
Python采集淘宝评论API接口及JSON数据返回全流程指南
Python采集淘宝评论API接口及JSON数据返回全流程指南

推荐镜像

更多