CSV和JSON格式的数据在python上的处理

简介: CSV和JSON数据类型都是都是常见的两种在python中的数据分析类型,这里我有两个入门项目详细讲解这两种数据的处理。

处理一个CSV形式的地方的天气的数据,然后创建一个表格;
分析JSON形式的地震数据,然后用plotly绘制一幅散点图

项目一

import csv#csv这个模块是用于分析这种格式分析的模块
from datetime import datetime#处理事件的模块

from matplotlib import pyplot as plt#我们要画折线图,需要用到这个库的画图功能

filename = 'death_valley_2018_simple.csv'#文件的地址可以根据需求设置
with open(filename) as f:#打开文件,把它赋给f
    reader = csv.reader(f)#传递给reader
    header_row = next(reader)
    #读取文件相关的文件头,这里如果用print的话你会看到每行都行都有哪些数据,来分析出我们要的最高温和最低温在哪个位置

    # 当分析出来后,我们就可以从文件获取数据了,我们要的数据的在45行
    dates, highs, lows = [], [], []#创建列表收录数据、最高、最低值
    for row in reader:
        current_date = datetime.strptime(row[2], '%Y-%m-%d')
        try:
            high = int(row[4])
            low = int(row[5])
        except ValueError:
            print(f"Missing data for {current_date}")
        else:
            dates.append(current_date)
            highs.append(high)
            lows.append(low)
            #把数据写入列表中

# 绘制图形
plt.style.use('seaborn')
fig, ax = plt.subplots()
ax.plot(dates, highs, c='red', alpha=0.5)
ax.plot(dates, lows, c='blue', alpha=0.5)
plt.fill_between(dates, highs, lows, facecolor='blue', alpha=0.1)

# 设置一些表头、横轴、纵轴的名称等信息
title = "Daily high and low temperatures - 2018\nDeath Valley, CA"
plt.title(title, fontsize=20)
plt.xlabel('', fontsize=16)
fig.autofmt_xdate()
plt.ylabel("Temperature (F)", fontsize=16)
plt.tick_params(axis='both', which='major', labelsize=16)

plt.show()#显示图像

截屏2023-12-27 下午8.17.55.png

这段代码是用于读取并分析一个名为 'death_valley_2018_simple.csv' 的文件,并绘制该文件中的数据所代表的最高温度和最低温度的折线图。

首先,代码导入了必要的模块。csv 模块用于处理以逗号分隔的文件(CSV格式),datetime 模块用于处理日期和时间,matplotlib.pyplot 模块用于绘制图表。

然后,代码指定了要读取的文件名为 'death_valley_2018_simple.csv'。接下来使用 with open(filename) as f 打开文件,并将其赋值给变量 f。这样做可以确保在代码块结束后自动关闭文件。

接着,代码通过 csv.reader(f) 创建了一个 CSV 读取器对象 reader,用于逐行读取文件中的数据。通过调用 next(reader),我们可以获取文件的头部信息,即第一行的数据,以便进行进一步分析。

在获取了文件头部信息之后,代码通过循环遍历 reader 对象,逐行读取文件中的数据。在每一行中,使用 datetime.strptime(row[2], '%Y-%m-%d') 将日期字符串转换为 datetime 对象,方便后续的处理。然后,通过 int(row[4]) 和 int(row[5]) 将最高温度和最低温度转换为整数类型,并将它们分别存储到 highs 和 lows 列表中。如果转换过程中出现错误(比如数据缺失或格式不正确),则会打印出相应的错误信息。

循环结束后,代码得到了日期、最高温度和最低温度的列表,即 dates、highs 和 lows。接下来,使用 plt.style.use('seaborn') 设定绘图的样式,然后通过 plt.subplots() 创建一个包含单个子图的图表对象 fig 和子图对象 ax。

使用 ax.plot(dates, highs, c='red', alpha=0.5) 和 ax.plot(dates, lows, c='blue', alpha=0.5) 分别绘制了最高温度和最低温度的折线图。在 plt.fill_between(dates, highs, lows, facecolor='blue', alpha=0.1) 中,使用蓝色填充了最高温度和最低温度之间的区域,以增强可视化效果。

接下来,代码设置了图表的标题、横轴和纵轴的标签,并通过 fig.autofmt_xdate() 自动调整横轴日期的显示方式,以免重叠。最后,通过 plt.show() 显示绘制的图表。

总结来说,这段代码从文件中读取并解析数据,然后使用 matplotlib 绘制了最高温度和最低温度的折线图,以便更直观地展示数据的变化趋势。

项目二

import json#这是在处理json数据时要用的模块
import plotly.express as px#这个plotly的高级接口需要用来绘制图像
import pandas as pd#我们这里对图像进行优化会用到这个数据分析工具


filename = 'eq_data_30_day_m1.json'
with open(filename) as f:
    all_eq_data = json.load(f)
    #把文件的数据写入all_eq_data中

   #根据对数据的分析展开,我们会获得一系列的重要的信息,这里我就直接给出了,数据与键‘features'有关,所以把它储存下来
all_eq_dicts = all_eq_data['features']
mags, titles, lons, lats = [], [], [], []#创建空列表
for eq_dict in all_eq_dicts:
    mag = eq_dict['properties']['mag']
    title = eq_dict['properties']['title']
    lon = eq_dict['geometry']['coordinates'][0]
    lat = eq_dict['geometry']['coordinates'][1]
    mags.append(mag)
    titles.append(title)
    lons.append(lon)
    lats.append(lat)
    #提取震级、位置标题、经纬度

data = pd.DataFrame(
    data=zip(lons, lats, titles, mags), columns=['经度', '纬度', '位置', '震级']
)
#因为我们这里要使用到pandas数据分析工具,我们这里对数据进行封装
fig = px.scatter(
    data,
    x='经度',
    y='纬度',
    range_x=[-200, 200],
    range_y=[-90, 90],
    #我们假定了经纬度的绘制范围
    width=800,
    height=800,
    title='全球地震散点图',
    size='震级',
    size_max=10,
    color='震级',#这里定制标记颜色,震级可以按照不同颜色显示,数值越大颜色越黄,从蓝到红到黄渐变
    hover_name='位置',
)
fig.write_html('global_earthquakes.html')#将视图保存为html文件,可以在浏览器打开
fig.show()#如果用的是jupyter,使用这个可以直接显示散点图

截屏2023-12-27 下午8.18.17.png

这段代码的功能是读取名为 'eq_data_30_day_m1.json' 的 JSON 文件,并将其中地震数据的经度、纬度、位置和震级等信息提取出来,然后使用 Plotly 库绘制全球地震散点图,并将图表保存为 HTML 文件。

首先,代码导入了必要的模块。json 模块用于处理 JSON 数据,plotly.express 用于绘制图表,pandas 用于数据分析。

接着,代码打开名为 'eq_data_30_day_m1.json' 的文件,并将其中的数据加载到变量 all_eq_data 中。

随后,代码从 all_eq_data 中提取出与键 'features' 相关的地震数据,并将其存储在列表 all_eq_dicts 中。

接下来,代码创建了空列表 mags、titles、lons 和 lats,用于分别存储地震的震级、位置标题、经度和纬度信息。然后通过循环遍历 all_eq_dicts,逐个提取出每个地震事件的震级、位置标题、经度和纬度,并将它们分别添加到对应的列表中。

在获取了所有地震事件的相关信息之后,代码使用 pd.DataFrame 创建了一个 DataFrame 对象 data,并将提取到的地震数据进行了封装。

然后,代码使用 px.scatter 创建了一个散点图对象 fig,并指定了散点图的横轴、纵轴、范围、宽度、高度、标题、点大小、颜色和悬停文本等属性。接着,通过 fig.write_html('global_earthquakes.html') 将绘制的散点图保存为 HTML 文件,以便在浏览器中打开查看。

最后,代码调用 fig.show() 来显示绘制的散点图。

总而言之,这段代码通过处理 JSON 文件中的地震数据,使用 Plotly 库绘制了全球地震散点图,并将图表保存为 HTML 文件,以便进行展示和分享。

相关文章
|
8天前
|
JSON JavaScript Java
对比JSON和Hessian2的序列化格式
通过以上对比分析,希望能够帮助开发者在不同场景下选择最适合的序列化格式,提高系统的整体性能和可维护性。
13 3
|
13天前
|
图形学 Python
SciPy 空间数据2
凸包(Convex Hull)是计算几何中的概念,指包含给定点集的所有凸集的交集。可以通过 `ConvexHull()` 方法创建凸包。示例代码展示了如何使用 `scipy` 库和 `matplotlib` 绘制给定点集的凸包。
22 1
|
14天前
|
JSON 数据格式 索引
Python中序列化/反序列化JSON格式的数据
【11月更文挑战第4天】本文介绍了 Python 中使用 `json` 模块进行序列化和反序列化的操作。序列化是指将 Python 对象(如字典、列表)转换为 JSON 字符串,主要使用 `json.dumps` 方法。示例包括基本的字典和列表序列化,以及自定义类的序列化。反序列化则是将 JSON 字符串转换回 Python 对象,使用 `json.loads` 方法。文中还提供了具体的代码示例,展示了如何处理不同类型的 Python 对象。
|
11天前
|
JSON API 数据安全/隐私保护
拍立淘按图搜索API接口返回数据的JSON格式示例
拍立淘按图搜索API接口允许用户通过上传图片来搜索相似的商品,该接口返回的通常是一个JSON格式的响应,其中包含了与上传图片相似的商品信息。以下是一个基于淘宝平台的拍立淘按图搜索API接口返回数据的JSON格式示例,同时提供对其关键字段的解释
|
13天前
|
索引 Python
SciPy 空间数据1
SciPy 通过 `scipy.spatial` 模块处理空间数据,如判断点是否在边界内、计算最近点等。三角测量是通过测量角度来确定目标距离的方法。多边形的三角测量可将其分解为多个三角形,用于计算面积。Delaunay 三角剖分是一种常用方法,可以对一系列点进行三角剖分。示例代码展示了如何使用 `Delaunay()` 函数创建三角形并绘制。
22 0
|
2月前
|
XML 存储 JSON
Twaver-HTML5基础学习(19)数据容器(2)_数据序列化_XML、Json
本文介绍了Twaver HTML5中的数据序列化,包括XML和JSON格式的序列化与反序列化方法。文章通过示例代码展示了如何将DataBox中的数据序列化为XML和JSON字符串,以及如何从这些字符串中反序列化数据,重建DataBox中的对象。此外,还提到了用户自定义属性的序列化注册方法。
47 1
|
28天前
|
数据采集 JSON 数据处理
抓取和分析JSON数据:使用Python构建数据处理管道
在大数据时代,电商网站如亚马逊、京东等成为数据采集的重要来源。本文介绍如何使用Python结合代理IP、多线程等技术,高效、隐秘地抓取并处理电商网站的JSON数据。通过爬虫代理服务,模拟真实用户行为,提升抓取效率和稳定性。示例代码展示了如何抓取亚马逊商品信息并进行解析。
抓取和分析JSON数据:使用Python构建数据处理管道
|
18天前
|
JSON 缓存 前端开发
PHP如何高效地处理JSON数据:从编码到解码
在现代Web开发中,JSON已成为数据交换的标准格式。本文探讨了PHP如何高效处理JSON数据,包括编码和解码的过程。通过简化数据结构、使用优化选项、缓存机制及合理设置解码参数等方法,可以显著提升JSON处理的性能,确保系统快速稳定运行。
|
1月前
|
JSON JavaScript Java
在Java中处理JSON数据:Jackson与Gson库比较
本文介绍了JSON数据交换格式及其在Java中的应用,重点探讨了两个强大的JSON处理库——Jackson和Gson。文章详细讲解了Jackson库的核心功能,包括数据绑定、流式API和树模型,并通过示例演示了如何使用Jackson进行JSON解析和生成。最后,作者分享了一些实用的代码片段和使用技巧,帮助读者更好地理解和应用这些工具。
在Java中处理JSON数据:Jackson与Gson库比较
|
1月前
|
JSON JavaScript API
(API接口系列)商品详情数据封装接口json数据格式分析
在成长的路上,我们都是同行者。这篇关于商品详情API接口的文章,希望能帮助到您。期待与您继续分享更多API接口的知识,请记得关注Anzexi58哦!