Python知识点——高维数据的格式化

简介: Python知识点——高维数据的格式化

常用JSON格式对高维数据进行表达和存储:

常见的高维数据最典型的例子:<key,value>键值对

JSON格式表达键值对<key, value>的基本格式如下,键值对都保存在双引号中:

"key" : "value"

Json库

dumps()和loads()分别对应编码和解码功能

函数 描述
json.dumps(obj,sort_keys=False,indent=None) 将Python的数据类型转换为JSON格式,编码过程
son.loads(string) JSON格式字符串转换为Python的数据类型,解码过程
son.dump(obj, fp, sort_keys=False, indent=None) dumps()功能一致,输出到文件fp
json.load(fp) loads()功能一致,从文件fp读入

常见参数的含义

sort_keys:一个布尔值,表示是否按照键的顺序对字典进行排序。如果设置为 True,生成的 JSON 字符串会按照键的字母顺序排列;默认为 False。


indent:一个整数或者字符串,用于指定生成的 JSON 字符串的缩进格式。如果是一个整数,表示每一级的缩进空格数;如果是一个字符串(比如 '\t'),表示使用指定的字符串作为缩进。如果设置为 None(默认值),则表示不使用缩进,生成的 JSON 字符串会是单行的形式。


skipkeys:一个布尔值,表示是否跳过那些非字符串类型的键。如果设置为 True,在转换字典为 JSON 字符串时,如果字典的键不是字符串类型,会跳过这些键;默认为 False。


ensure_ascii:一个布尔值,表示是否确保生成的 JSON 字符串中只包含 ASCII 字符。如果设置为 False,生成的 JSON 字符串可以包含非 ASCII 字符;默认为 True。


separators:一个元组,用于指定生成的 JSON 字符串中的分隔符。默认为 (','  ,  ':'),表示键值对之间用逗号分隔,键和值之间用冒号分隔。

举例

import json
 
data = {'name': 'Alice', 'age': 30, 'city': 'New York'}
 
# 将字典转换为 JSON 字符串,不排序键,不缩进
json_str1 = json.dumps(data, sort_keys=False, indent=None)
 
# 将字典转换为 JSON 字符串,排序键,使用4个空格作为缩进
json_str2 = json.dumps(data, sort_keys=True, indent=4)
 
# 将字典转换为 JSON 字符串,跳过非字符串类型的键,确保生成的 JSON 字符串中只包含 ASCII 字符
json_str3 = json.dumps(data, skipkeys=True, ensure_ascii=True)
 
print(json_str1)
print(json_str2)
print(json_str3)

注:s1和s2分别代表了按不同方式生成的 JSON 字符串,所以是不同的

>>>dt = {'b':2,'c':4,'a':6}
>>>s1 = json.dumps(dt)  #dumps返回JSON格式的字符串类型
>>>s2 = json.dumps(dt,sort_keys=True,indent=4)
>>>print(s1)
{"c": 4, "a": 6, "b": 2}
>>>print(s2)
{
    "a": 6,
    "b": 2,
    "c": 4
}
>>>print(s1==s2)
False
>>>dt2 = json.loads(s2)
>>>print(dt2, type(dt2))
{'c': 4, 'a': 6, 'b': 2} <class 'dict'>

CSV与JSON格式相互转换

将CSV转换成JSON格式

链接:https://pan.baidu.com/s/1CV6OkG8bc36ppPf8D7GjJw 

提取码:hnlq

import json
fr = open("price2016.csv", "r")
ls = []
for line in fr:
    line = line.replace("\n","")
    ls.append(line.split(','))
fr.close()
fw = open("price2016.json", "w")
for i in range(1,len(ls)):
    ls[i] = dict(zip(ls[0], ls[i]))
json.dump(ls[1:],fw, sort_keys=True, indent=4)
fw.close()

将二维JSON格式数据转换成CSV格式

链接:https://pan.baidu.com/s/1yxE4gdjaym4jupvWk1EnKA 

提取码:5oz1

import json
fr = open("D:\\price2016.json", "r",encoding="utf-8")
ls = json.load(fr)
data = [ list(ls[0].keys()) ]
for item in ls:
    data.append(list(item.values()))
fr.close()
fw = open("D:\\price2016_from_json.csv", "w",encoding="utf-8")
for item in data:
    fw.write(",".join(item) + "\n")
fw.close()

注:打开json文件和写入csv文件时一定要加入encoding="utf-8",否则会报

目录
相关文章
|
5天前
|
存储 JSON JavaScript
使用Python处理JSON格式数据
使用Python处理JSON格式数据
|
16小时前
|
API Python
使用Python获取HTTP请求头数据
在Python Web开发中,`requests`库用于发送HTTP请求,请求头是关键元素,包含客户端信息和请求详情。要查看请求头,先创建`Request`对象,打印其`headers`属性,然后使用`get`等方法发送请求并获取响应头。别忘了处理不同HTTP方法、内容类型以及异常。使用`Session`管理会话状态,并考虑日志记录以调试。通过控制请求头,能有效与服务器通信。
10 0
|
22小时前
|
XML 前端开发 数据挖掘
Web数据提取:Python中BeautifulSoup与htmltab的结合使用
Web数据提取:Python中BeautifulSoup与htmltab的结合使用
|
2天前
|
数据采集 存储 数据挖掘
Python网络爬虫实战:抓取并分析网页数据
使用Python的`requests`和`BeautifulSoup`,本文演示了一个简单的网络爬虫,抓取天气网站数据并进行分析。步骤包括发送HTTP请求获取HTML,解析HTML提取温度和湿度信息,以及计算平均温度。注意事项涉及遵守robots.txt、控制请求频率及处理动态内容。此基础爬虫展示了数据自动收集和初步分析的基础流程。【6月更文挑战第14天】
53 9
|
2天前
|
存储 安全 Java
在Python中,引用和赋值机制是理解变量和数据对象之间关系的关键
【6月更文挑战第16天】Python变量是对象引用,不存储数据,指向内存中的对象。赋值`=`创建引用,不复制对象。`b = a`时,a和b指向同一对象。引用计数管理对象生命周期,垃圾回收在引用数为0时回收对象。理解这些机制对优化内存使用关键。
21 7
|
3天前
|
存储 Python 容器
【Python数据魔术】:揭秘类型奥秘,赋能代码创造
【Python数据魔术】:揭秘类型奥秘,赋能代码创造
|
3天前
|
存储 索引 Python
【Python列表解锁】:掌握序列精髓,驾驭动态数据集合
【Python列表解锁】:掌握序列精髓,驾驭动态数据集合
|
3天前
|
IDE 开发工具 Python
black--一键格式化Python代码
black--一键格式化Python代码
|
4天前
|
JSON API 数据格式
如何用 Python 的 requests 库发送 JSON 数据的 POST 请求
使用 requests 库发送 JSON 数据的 POST 请求是一个非常简单且实用的操作。通过将目标 URL 和 JSON 数据传递给 requests.post 方法,你可以轻松发送请求并处理响应。本篇文章介绍了从安装 requests 库,到发送 JSON 数据的 POST 请求,再到处理响应的整个流程。希望这篇文章能帮助你更好地理解并应用这个强大的 HTTP 请求库。
|
4天前
|
XML 数据格式 Python
Python使用xpath对解析内容进行数据提取
在前面的文章当中,已经教大家如何去获取我们需要的数据原文内容,今天就介绍一个用于提取所需数据的方法之一xpath。在后续会讲解bs4(beautifulsoup),re正则表达式。