数据导入与预处理-第4章-Python标准库之json

简介: 数据导入与预处理-第4章-Python标准库之json


资源

参考:https://zhuanlan.zhihu.com/p/436465279


json概述

什么是json

json是一种轻量级的文本数据

交换格式json独立于其他语言

json具有自我描述性,更好理解

json比xml更小、更快,更容易解析

json格式

{
    "name":"lhh",
    "age":"20"
}

json标准库的作用

使用json字符串生成python对象(load)

由python对象格式成为json字符串(dump)

数据的类型转换

将数据从python转换到json格式,在数据类型上会有什么变化呢,如下表所示:

Python JSON
dict object
list,tuple array
str string
int,float,int- number
True true
False false
None null

使用方式

方法 功能
json.dump(obj,fp) 将python数据类型转换并保存到json格式的文件内
json.dumps(obj) 将python数据类型转换为json格式的字符串
json.load(obj) 将json格式的文件中读取数据并转换为python类型
json.loads(s) 将json格式的字符串转换为python的类型

json案例

dumps案例

import json
#从python对象格式化一个json  string
person = {"name":"张某某","gender":"man","age":25}
print(person)
#转换为json字符串
jsonStr = json.dumps(person,)
print(jsonStr)
#转换为json字符串 中文编码避免
jsonStr = json.dumps(person,ensure_ascii=False)
print(jsonStr)

输出为:

在python中定义json的时候,可以使用单引号,也可以使用双引号。但是最后在输出的时候,输出的是一个单引号,以字典的方式进行输出的。

我们进行json格式转换之后,我们就会变成一个标准的json格式的字符串,即双引号修饰的字符串

对于包含中文的内容,会被转码为\u开头,这时可以通过ensure_ascii=False完成中文输出。json_dumps(dict)时,如果dict包含有汉字,一定加上ensure_ascii=False。否则按参数默认值True,意思是保证dumps之后的结果里所有的字符都能够被ascii表示,汉字在ascii的字符集里面,因此经过dumps以后的str里,汉字会变成对应的unicode。

dump案例

中文编码问题

import json
#从python对象格式化一个json  string
person = {"name":"张某某","gender":"man","age":25}
print(person)
#转换为json文件
json.dump(person,open("data.json","w"))
#转换为json文件,文件内容为中文  
json.dump(person,open("data1.json","w",encoding="utf-8"),ensure_ascii=False)

输出为:

格式化问题

import json
#从python对象格式化一个json  string
person = {"name":"张某某","gender":"man","age":25}
print(person)
#转换为json文件
json.dump(person,open("data.json","w"))
#转换为json文件,文件内容为中文  
json.dump(person,
          open("data1.json","w",encoding="utf-8"),
          ensure_ascii=False,
          indent=4)

输出为:

import json
#从python对象格式化一个json  string
person = {"name":"张某某","gender":"man","age":25}
print(person)
#转换为json文件,文件内容为中文  
json.dump(person,
          open("data1.json","w",encoding="utf-8"),
          ensure_ascii=False,
          indent=4,
          sort_keys=True)

输出为:

loads案例

import json
data = {'name':'张某某','gender':'man','age':18}
# 将Python对象编码成json字符串
# print(json.dumps(data))
# 将json字符串解码成Python对象
a = json.dumps(data)
print(json.loads(a))
print('+'*10)
data = (1,2,3,4)
data_json = [1,2,3,4]
#将Python对象编码成json字符串
print(json.dumps(data))
print(json.dumps(data_json))
print('+'*10)
#将Python对象编码成json字符串
a = json.dumps(data)
b = json.dumps(data_json)
print('+'*10)
#将json字符串编码成Python对象
print(json.loads(a))
print(json.loads(b))

输出为

load案例

相关文章
|
12天前
|
数据采集 JSON 测试技术
如何在Python中高效实现CSV到JSON的数据转换
在实际项目中,数据格式转换是常见问题,尤其从CSV到JSON的转换。本文深入探讨了多种转换方法,涵盖Python基础实现、数据预处理、错误处理、性能优化及调试验证技巧。通过分块处理、并行处理等手段提升大文件转换效率,并介绍如何封装为命令行工具或Web API,实现自动化批量处理。关键点包括基础实现、数据清洗、异常捕获、性能优化和单元测试,确保转换流程稳定高效。
128 83
|
3月前
|
数据采集 数据可视化 数据挖掘
利用Python自动化处理Excel数据:从基础到进阶####
本文旨在为读者提供一个全面的指南,通过Python编程语言实现Excel数据的自动化处理。无论你是初学者还是有经验的开发者,本文都将帮助你掌握Pandas和openpyxl这两个强大的库,从而提升数据处理的效率和准确性。我们将从环境设置开始,逐步深入到数据读取、清洗、分析和可视化等各个环节,最终实现一个实际的自动化项目案例。 ####
372 10
|
18天前
|
数据采集 数据安全/隐私保护 Python
从零开始:用Python爬取网站的汽车品牌和价格数据
在现代化办公室中,工程师小李和产品经理小张讨论如何获取懂车帝网站的汽车品牌和价格数据。小李提出使用Python编写爬虫,并通过亿牛云爬虫代理避免被封禁。代码实现包括设置代理、请求头、解析网页内容、多线程爬取等步骤,确保高效且稳定地抓取数据。小张表示理解并准备按照指导操作。
从零开始:用Python爬取网站的汽车品牌和价格数据
|
1天前
|
人工智能 自然语言处理 Shell
[oeasy]python070_如何导入模块_导入模块的作用_hello_dunder_双下划线
本文介绍了如何在Python中导入模块及其作用,重点讲解了`__hello__`模块的导入与使用。通过`import`命令可以将外部模块引入当前环境,增强代码功能。例如,导入`__hello__`模块后可输出“Hello world!”。此外,还演示了如何使用`help()`和`dir()`函数查询模块信息,并展示了导入多个模块的方法。最后,通过一个实例,介绍了如何利用`jieba`、`WordCloud`和`matplotlib`模块生成词云图。总结来说,模块是封装好的功能部件,能够简化编程任务并提高效率。未来将探讨如何创建自定义模块。
23 8
|
13天前
|
算法 Serverless 数据处理
从集思录可转债数据探秘:Python与C++实现的移动平均算法应用
本文探讨了如何利用移动平均算法分析集思录提供的可转债数据,帮助投资者把握价格趋势。通过Python和C++两种编程语言实现简单移动平均(SMA),展示了数据处理的具体方法。Python代码借助`pandas`库轻松计算5日SMA,而C++代码则通过高效的数据处理展示了SMA的计算过程。集思录平台提供了详尽且及时的可转债数据,助力投资者结合算法与社区讨论,做出更明智的投资决策。掌握这些工具和技术,有助于在复杂多变的金融市场中挖掘更多价值。
41 12
|
5天前
|
数据采集 供应链 API
实战指南:通过1688开放平台API获取商品详情数据(附Python代码及避坑指南)
1688作为国内最大的B2B供应链平台,其API为企业提供合法合规的JSON数据源,直接获取批发价、SKU库存等核心数据。相比爬虫方案,官方API避免了反爬严格、数据缺失和法律风险等问题。企业接入1688商品API需完成资质认证、创建应用、签名机制解析及调用接口四步。应用场景包括智能采购系统、供应商评估模型和跨境选品分析。提供高频问题解决方案及安全合规实践,确保数据安全与合法使用。立即访问1688开放平台,解锁B2B数据宝藏!
|
12天前
|
数据采集 存储 前端开发
用Python抓取亚马逊动态加载数据,一文读懂
用Python抓取亚马逊动态加载数据,一文读懂
|
4天前
|
存储 数据采集 JSON
Python爬取某云热歌榜:解析动态加载的歌曲数据
Python爬取某云热歌榜:解析动态加载的歌曲数据
|
2月前
|
数据采集 Web App开发 数据可视化
Python用代理IP获取抖音电商达人主播数据
在当今数字化时代,电商直播成为重要的销售模式,抖音电商汇聚了众多达人主播。了解这些主播的数据对于品牌和商家至关重要。然而,直接从平台获取数据并非易事。本文介绍如何使用Python和代理IP高效抓取抖音电商达人主播的关键数据,包括主播昵称、ID、直播间链接、观看人数、点赞数和商品列表等。通过环境准备、代码实战及数据处理与可视化,最终实现定时任务自动化抓取,为企业决策提供有力支持。
|
3月前
|
数据采集 Web App开发 监控
Python爬虫:爱奇艺榜单数据的实时监控
Python爬虫:爱奇艺榜单数据的实时监控

热门文章

最新文章