森林野火故事2.0:一眼看穿!使用 Panel 和 hvPlot 可视化 ⛵

简介: 本文讲解使用Panel、hvPlot等工具库,简单快速地制作可交互的数据仪表板,对180万起野火数据进行空间可视化,更直观地对起火原因、火势大小、持续时长进行单维或多维分析。
b30e08c2b11df7bd52d894c3326a5cf5.png
💡 作者: 韩信子@ ShowMeAI
📘 数据分析实战系列https://www.showmeai.tech/tutorials/40
📘 本文地址https://www.showmeai.tech/article-detail/335
📢 声明:版权所有,转载请联系平台与作者并注明出处
📢 收藏 ShowMeAI查看更多精彩内容
afa5e06d7260457c653cc04550e61b58.png

📘Panel 是 Python 中一个非常棒的可以用作制作数据仪表板的工具库,基于它可以轻松构建数据可视化看板。

594169565a15eec82e85154c13c193f6.png

在本篇内容中,ShowMeAI 综合 Python 可视化与呈现技能,使用 Panel 制作一个仪表盘看板,可以交互查看美国野火记录的信息。

3f1d1027e76028060f163d208d10f6a1.png

💡 导入工具库

我们本次需要用到的工具库包括数据库工具、Python 数据处理工具、可视化工具和看板工具,我们先把这些工具库导入,代码如下:

# 数据库
import sqlite3

# 数据处理
import numpy as np
import pandas as pd

# 可视化与仪表盘
import holoviews as hv 
import colorcet as cc
import panel as pn

from holoviews.element.tiles import EsriImagery
from datashader.utils import lnglat_to_meters
import hvplot.pandas
hv.extension('bokeh')

💡 数据准备

用于本次可视化的数据集包含 1992 年至 2015 年间在美国发生的超过 180 万起野火。🏆美国野火数据集可以在 ShowMeAI 的百度网盘地址下载。

🏆 实战数据集下载(百度网盘):公✦众✦号『ShowMeAI研究中心』回复『 实战』,或者点击 这里 获取本文 [[28]基于Panel和hvPlot的可视化交互看板实战案例]( https://www.showmeai.tech/article-detail/335)美国野火 FPA_FOD_20170508.sqlite 数据集

ShowMeAI官方GitHubhttps://github.com/ShowMeAI-Hub

我们希望构建一个数据仪表板,帮助我们更好地了解导致这些野火的原因、发生地点等信息。我们导入数据并选出需要的信息,代码如下:

# 连接数据库
conn = sqlite3.connect('../data/FPA_FOD_20170508.sqlite')

# 选取信息:经纬度、原因描述、火势大小与等级、日期、所在州、年份 等
df = pd.read_sql_query("SELECT LATITUDE, LONGITUDE, STAT_CAUSE_DESCR, FIRE_SIZE, FIRE_SIZE_CLASS, DISCOVERY_DATE, CONT_DATE, STATE, FIRE_YEAR FROM fires", conn)

# 数据中有一些不在美国的记录,删除它们
df = df.loc[(df.loc[:,'STATE']!='AK') & (df.loc[:,'STATE']!='HI') & (df.loc[:,'STATE']!='PR')]

# 计算野火持续时间
df['BURN_TIME'] = df['CONT_DATE'] - df['DISCOVERY_DATE']

# 查看数据
df.head()
b0db55d9ce51e2e0ea4a9a771dd3f22b.png

💡 野火地图

我们先把所有历史火灾绘制成热度地图,这样我们可以直观看到空间分布。借助 📘hvPlot 可以很容易完成(它利用 Datashader 来栅格化我们的 180 万个点,使得它们更易于渲染)。

80aa71f85478f5be72d49491fc49e49b.png

具体的代码如下:

map_tiles = EsriImagery().opts(alpha=0.5, width=700, height=480, bgcolor='black')
plot = df.hvplot(
    'LONGITUDE', 
    'LATITUDE', 
    geo=True,
    kind='points', 
    rasterize=True, 
    cmap=cc.fire, 
    cnorm='eq_hist',  
    colorbar=True).opts(colorbar_position='bottom', xlabel='', ylabel='')
map_tiles * plot
7169ffe25396a918fab425d744554b4a.gif

简单的一组代码即可实现上述可视化结果,hvPlot 是一个非常棒的空间可视化工具库,它利用了其他 📘Holoviz 库——📘Holoviews、📘Geoviews、📘Datashader 和 📘Colorcet,所以可以极大简化创建大型数据集的交互式地图所需步骤。

955c68a03341c98acc3d201ced55cbde.png

💡 带时间滑块的仪表板

Panel 的小部件让我们可以访问各种方法来操作和切分我们的数据子集可视化,例如对时间序列数据可切分:加入选择年份的滑块

使用 Panel 制作这种仪表板,分为3个步骤:

  • ① 定义一个小部件,例如用于选择年份或下拉列表的整数滑块。
  • ② 定义一个绘图函数,将滑块中的年份值作为输入。
  • ③ 布局和渲染我们的仪表板。
# 为时间序列构建滑动小组件
year = pn.widgets.IntSlider(name='Year Slider', width=300,
                                 start=1992, end=2015, value=(1993),
                                 step=1,value_throttled=(1993))

# 展示当前年份
@pn.depends(year.param.value_throttled)
def year_selected(year):
    return '## Wildfires Across the US in {}'.format(year)

# 实际绘图函数
@pn.depends(year.param.value_throttled)
def plot_map(year):
    year_df = df[df['FIRE_YEAR'] == year].copy()
    plot = year_df.hvplot(
        'LONGITUDE', 
        'LATITUDE', 
        geo=True,
        kind='points', 
        rasterize=True, 
        cmap=cc.fire, 
        cnorm='eq_hist',  
        colorbar=True).opts(colorbar_position='bottom', xlabel='', ylabel='')
    return map_tiles * plot


dashboard = pn.WidgetBox(pn.Column(pn.Row(year_selected, year),
                         pn.Row(pn.bind(plot_map, year)), align="start",
                         sizing_mode="stretch_width"))
0060yMmAly1h6dezf05b2g30m80h77wr.gif

💡 更简单的构建方式

当我们的绘图只有一个小部件要显示时,有一种更简单的方式:我们可以改为使用.interactive制作我们的 DataFrame 和数据管道的交互式副本。

下面我们用一个示例来演示如何使用这个方法:这次我们的条件是『火灾的原因』,我们让地图只显示每个原因下的火灾。

select_cause = pn.widgets.Select(
    options = df['STAT_CAUSE_DESCR'].value_counts().index.tolist(),
    name = 'Cause')

# 动态交互
dfi = df.interactive


iplot = dfi[dfi['STAT_CAUSE_DESCR']==select_cause].hvplot(
    'LONGITUDE', 
    'LATITUDE', 
    geo=True,
    kind='points', 
    rasterize=True, 
    cmap=cc.fire, 
    cnorm='eq_hist',  
    colorbar=True).opts(colorbar_position='bottom', xlabel='', ylabel='', title='Wildfires by Cause from 1992-2015') 


map_tiles.opts(level='underlay') * iplot
0060yMmAly1h6deznze8hg30m80h7b2q.gif

💡 组合仪表板

我们可以构建更强大的组合仪表盘,它让我们能够同时查看数据的多个维度信息。下面我们创建一些可视化图例,然后使用 Panel 将它们组合在一起。

💦 火势大小

我们先绘制每个规模等级发生的火灾数量:野火按燃烧区域的大小进行分类,A 级最小,G 级最大。

@pn.depends(year.param.value_throttled)
def plot_class(year):
    year_df = df[df['FIRE_YEAR'] == year].copy()
    count_df = pd.DataFrame(year_df.groupby('FIRE_SIZE_CLASS').size(), columns=['Count'])
    count_df['Fire Class'] = count_df.index
    return count_df.hvplot.bar(x='Fire Class', y='Count', c='Fire Class', cmap='fire', 
                legend=False).opts(xlabel="Fire Size Class", ylabel="Number of Fires",
                title="Wildfires in {} Grouped by Size Classification".format(year))
              
plot_class(2006)
f144a1139d6e6632ef3125903344dd71.png

注意到上述绘图函数将『年份』作为参数,这样它可以在滑块值更改时对数据进行子集切分和呈现。拿到对应的数据子集后,我们把它按大小分类进行分组,并使用.size()计算每组的火灾次数。

💦 起火原因 & 持续时长

下面我们对『起火原因和对应的持续时长』进行分析可视化(注意,这里和上面的模块一样,也是传入年份作为参数,这样我们最后的组合绘图,可以有统一的数据子集切分方式)。

@pn.depends(year.param.value_throttled)
def plot_cause_burn(year):
    year_df = df[df['FIRE_YEAR'] == year].copy()
    caused_df = pd.DataFrame(year_df.groupby('STAT_CAUSE_DESCR')[['BURN_TIME']].mean().sort_values('BURN_TIME'))
    caused_df['Fire Cause'] = caused_df.index
    return caused_df.hvplot.barh(x='Fire Cause', y='BURN_TIME', 
                                 c='Fire Cause', cmap='fire_r', legend=False).opts(
                                 ylabel="Burn Time (Days)",
                                 title="Wildfire Burn time Grouped by Cause in {}".format(year))
                
                
plot_cause_burn(2003)
e0736a15efee519a3b78e87a67b96f50.png

💦 起火原因 & 火灾数量

下面我们对『起火原因和对应的数量』进行分析可视化。

@pn.depends(year.param.value_throttled)
def plot_cause_count(year):
    year_df = df[df['FIRE_YEAR'] == year].copy()
    caused_df = pd.DataFrame(year_df.groupby('STAT_CAUSE_DESCR').size(), columns=['Count']).sort_values('Count')
    caused_df['Fire Cause'] = caused_df.index
    return caused_df.hvplot.barh(x='Fire Cause', y='Count', 
                                 c='Fire Cause', cmap='fire_r', 
                                 legend=False).opts(ylabel="Number of Fires",
                                 title="Number of Wildfires Grouped by Cause in {}".format(year))
                              
plot_cause_count(2003)
bcb51ef9e4e88247a3e0a97b0bc1e5e8.png

对比上图,我们可以看到一些有趣差异,例如:

  • 吸烟带来第2燃烧时长的野火,而它在引发的野火总数中排名第9。
  • 除了闪电之外,燃烧时间最长的火灾并不是最频繁发生的火灾。

这也解释了为什么野火难以扑灭,它们通常发生在更偏远的地方,很难及早控制。闪电、吸烟和营火都有可能在这些地区引发火灾,因为那里有大量木材可燃烧,而周围很少有人在早期发现迹象并报告烟雾。

也有一些年份看起来完全不同,例如 2006 年,电力线故障导致大火平均燃烧数天。如下图所示:

pn.Row(plot_cause_count(2006) , plot_cause_burn(2006), width=1000)
12a07598e0963b3f555234df2036a0f0.png

这里需要注意的是 Panel 和 hvPlot 如何识别这两个子图共享相同的 y 轴。

💦 分析结果组装

现在我们已经从不同维度进行了分析,我们使用小部件把它们进行组合,使我们可以沿着时间轴动态选择和做一些数据探索,构建组合仪表板的代码如下:

plots_box = pn.WidgetBox(pn.Column(pn.Row(pn.bind(fire_count, year), year),
                                   pn.Row(pn.bind(plot_map, year), pn.bind(plot_class, year)) ,
                                   pn.Row(pn.bind(plot_cause_count, year), pn.bind(plot_cause_burn, year)), align="start",
                                   width=800, sizing_mode="stretch_width"))


dashboard = pn.Row(plots_box, sizing_mode="stretch_width")
1f883fc6e698b9d3b02fd5da036030aa.gif

上面只是截取的一些gif动图,大家快快实际操作一下吧!会有更清晰的认识。

💡 总结

在本篇内容中 ShowMeAI 给大家讲解了使用 hvPlot 和 Panel 构建各种组合可视化看板仪表盘的方法,当我们需要进行数据探索和分析的时候,简单的一些数据分析可视化用 Pandas 和 Seaborn 等就可以快速完成,当我们需要一个交互式探索分析工具时,使用hvPlot 和 Panel 是一个非常棒的选择。

参考资料

e9190f41b8de4af38c8a1a0c96f0513b~tplv-k3u1fbpfcp-zoom-1.image

目录
相关文章
|
10月前
|
监控 数据可视化 安全
如何使用webgl(three.js)实现煤矿隧道、井下人员定位、掘进面、纵采面可视化解决方案——第十九课(一)
three.js、webgl、3D煤矿隧道、三维井下人员定位、掘进面三维可视化、纵采面可视化、采集面可视化展示、设备检测、数字孪生、物联网3D、3d建筑、3d库房,bim管理系统
240 1
|
13天前
|
人工智能 API 数据库
动手学Avalonia:基于硅基流动构建一个文生图应用(一)
动手学Avalonia:基于硅基流动构建一个文生图应用(一)
29 1
|
3月前
GPTs每日推荐--生化危机【典藏版】
GPTs每日推荐--生化危机【典藏版】
31 1
星际争霸之小霸王之小蜜蜂(十七)--究极体
星际争霸之小霸王之小蜜蜂(十七)--究极体
|
机器学习/深度学习 Web App开发 人工智能
7 Papers & Radios | 脑机接口让渐冻重症患者重获交流;295页博士论文探索强化学习抽象理论(1)
7 Papers & Radios | 脑机接口让渐冻重症患者重获交流;295页博士论文探索强化学习抽象理论
|
编解码 人工智能 数据可视化
施一公等团队登Science封面:AI与冷冻电镜揭示「原子级」NPC结构,生命科学突破
施一公等团队登Science封面:AI与冷冻电镜揭示「原子级」NPC结构,生命科学突破
162 0
|
机器学习/深度学习 存储 人工智能
7 Papers & Radios | 脑机接口让渐冻重症患者重获交流;295页博士论文探索强化学习抽象理论(2)
7 Papers & Radios | 脑机接口让渐冻重症患者重获交流;295页博士论文探索强化学习抽象理论
|
SQL Shell API
热饭的测开成果盘点第二十四期:diy数据构造平台
不多bb,直接上图。 该平台可让同事自行去设计 数据构造功能。包括sql/api/shell等等。 由我带着心鹏君开发完成。设计巧妙,可爱。 自行设计页面输入,描述等。
热饭的测开成果盘点第二十四期:diy数据构造平台
|
传感器 JavaScript 前端开发
震惊,偶像大神亲自上场,Cesium 50个实例集合,讲解、分析(内附源码)
生活是如此的艰难,还是学习来的简单,哈哈哈。亲爱的朋友们,还在为学习Cesium 苦恼吗,还在苦苦找不到Demo吗,来这里,来这里,资深大牛为你探路,助你快速学习Cesium 。
1409 0
震惊,偶像大神亲自上场,Cesium 50个实例集合,讲解、分析(内附源码)
|
数据可视化 uml
《如何画好架构图》读后感
《如何画好架构图》读后感
411 0
《如何画好架构图》读后感