Python 教程之数据分析(1)—— 使用 Bokeh 进行数据可视化

简介: Python 教程之数据分析(1)—— 使用 Bokeh 进行数据可视化

Bokeh是 Python 中的数据可视化库,提供高性能的交互式图表和绘图。Bokeh 输出可以在笔记本、html 和服务器等各种媒体中获得。可以在 Django 和烧瓶应用程序中嵌入散景图。


Bokeh 为用户提供了两个可视化界面:


bokeh.models:为应用程序开发人员提供高度灵活性的低级接口。

bokeh.plotting:用于创建视觉字形的高级界面。


要安装 bokeh 包,请在终端中运行以下命令:

pip install bokeh

用于生成散景图的数据集是从Kaggle收集的。


代码 #1: 散点标记

要创建散点圆标记,使用 circle() 方法。

# 导入模块
from bokeh.plotting import figure, output_notebook, show
# 输出到 notebook
output_notebook()
# 创建图
p = figure(plot_width = 400, plot_height = 400)
# 添加具有大小、颜色和 alpha 的圆形渲染器
p.circle([1, 2, 3, 4, 5], [4, 7, 1, 6, 3],
    size = 10, color = "navy", alpha = 0.5)
# 显示结果
show(p)

输出 :

image.png

代码 #2: 单行

要创建单行,使用 line() 方法。

# 导入模块
from bokeh.plotting import figure, output_notebook, show
# 输出到 notebook
output_notebook()
# 创建图
p = figure(plot_width = 400, plot_height = 400)
# 添加线渲染器
p.line([1, 2, 3, 4, 5], [3, 1, 2, 6, 5],
    line_width = 2, color = "green")
# 显示结果
show(p)

输出 :

image.png

代码 #3: 条形图

条形图用矩形条显示分类数据。条的长度与表示的值成比例。

# 导入必要的模块
import pandas as pd
from bokeh.charts import Bar, output_notebook, show
# 输出到 notebook
output_notebook()
# 读取数据框中的数据
df = pd.read_csv(r"D:/kaggle/mcdonald/menu.csv")
# 创建栏
p = Bar(df, "Category", values = "Calories",
    title = "Total Calories by Category",
            legend = "top_right")
# 显示结果
show(p)

输出 :


image.png

代码#4: 箱线图

箱线图用于表示图表上的统计数据。它有助于总结数据中存在的各种数据组的统计属性。

# 导入必要的模块
from bokeh.charts import BoxPlot, output_notebook, show
import pandas as pd
# 输出到 notebook
output_notebook()
# 读取数据框中的数据
df = pd.read_csv(r"D:/kaggle / mcdonald / menu.csv")
# 创建栏
p = BoxPlot(df, values = "Protein", label = "Category",
      color = "yellow", title = "Protein Summary (grouped by category)",
      legend = "top_right")
# 显示结果
show(p)

输出 :

image.png

代码#5: 直方图

直方图用于表示数值数据的分布。直方图中矩形的高度与类间隔中值的频率成正比。

# 导入必要的模块
from bokeh.charts import Histogram, output_notebook, show
import pandas as pd
# 输出到 notebook
output_notebook()
# 读取数据框中的数据
df = pd.read_csv(r"D:/kaggle / mcdonald / menu.csv")
# 创建直方图
p = Histogram(df, values = "Total Fat",
      title = "Total Fat Distribution",
      color = "navy")
# 显示结果
show(p)

输出 :

image.png

代码 #6: 散点图

散点图用于绘制数据集中两个变量的值。它有助于找到所选的两个变量之间的相关性。

# 导入必要的模块
from bokeh.charts import Scatter, output_notebook, show
import pandas as pd
# 输出到 notebook
output_notebook()
# 读取数据框中的数据
df = pd.read_csv(r"D:/kaggle / mcdonald / menu.csv")
# 创建散点图
p = Scatter(df, x = "Carbohydrates", y = "Saturated Fat",
      title = "Saturated Fat vs Carbohydrates",
      xlabel = "Carbohydrates", ylabel = "Saturated Fat",
      color = "orange")
# 显示结果
show(p)

输出:

image.png

感谢大家的阅读,有什么问题的话可以在评论中告诉我。希望大家能够给我来个点赞+收藏+评论 ,你的支持是海海更新的动力!后面我会持续分享前端 & 后端相关的专业知识。


目录
相关文章
|
8天前
|
机器学习/深度学习 数据采集 数据可视化
Python 数据分析:从零开始构建你的数据科学项目
【10月更文挑战第9天】Python 数据分析:从零开始构建你的数据科学项目
22 2
|
8天前
|
机器学习/深度学习 数据可视化 算法
使用Python进行数据分析:从零开始的指南
【10月更文挑战第9天】使用Python进行数据分析:从零开始的指南
22 1
|
8天前
|
数据采集 数据可视化 数据挖掘
使用Python进行高效的数据分析
【10月更文挑战第9天】使用Python进行高效的数据分析
13 1
|
8天前
|
数据采集 机器学习/深度学习 数据挖掘
如何使用Python进行高效的数据分析
【10月更文挑战第9天】如何使用Python进行高效的数据分析
16 1
|
10天前
|
数据采集 Web App开发 数据可视化
Python爬虫教程:Selenium可视化爬虫的快速入门
Python爬虫教程:Selenium可视化爬虫的快速入门
|
10天前
|
机器学习/深度学习 存储 数据挖掘
深入浅出:使用Python进行数据分析
【10月更文挑战第7天】本文将带你进入Python数据分析的世界,从基础的数据结构开始,逐步深入到数据处理、数据可视化以及机器学习等高级主题。我们将通过实际案例和代码示例,让你了解如何使用Python进行有效的数据分析。无论你是初学者还是有一定经验的开发者,都能从中获得新的知识和启发。
|
10天前
|
数据可视化 开发者 Python
使用Python进行数据可视化:从入门到精通
【10月更文挑战第7天】本文将引导您通过Python的可视化库,如Matplotlib和Seaborn,来探索和展示数据。我们将通过实际代码示例,学习如何创建各种图表,包括条形图、散点图和直方图等,并讨论如何优化这些图表以更好地传达信息。无论您是初学者还是有一定基础的开发者,这篇文章都能帮助您提高数据可视化技能。
|
13天前
|
数据可视化 Python
Python编程之数据可视化入门
【10月更文挑战第4天】在数字时代的洪流中,数据如同星辰般璀璨,而将它们绘制成图表,便是我们探索宇宙的方式。本文将带你启航,用Python这艘航船,驶向数据可视化的奥秘。我们将从安装必要的工具包开始,逐步深入到数据的呈现,最后通过代码示例点亮知识的灯塔,指引你在数据海洋中航行。让我们握紧舵盘,乘风破浪,揭开数据背后的故事吧!
|
12天前
|
机器学习/深度学习 数据采集 算法
探索Python科学计算的边界:NumPy、Pandas与SciPy在大规模数据分析中的高级应用
【10月更文挑战第5天】随着数据科学和机器学习领域的快速发展,处理大规模数据集的能力变得至关重要。Python凭借其强大的生态系统,尤其是NumPy、Pandas和SciPy等库的支持,在这个领域占据了重要地位。本文将深入探讨这些库如何帮助科学家和工程师高效地进行数据分析,并通过实际案例来展示它们的一些高级应用。
36 0
探索Python科学计算的边界:NumPy、Pandas与SciPy在大规模数据分析中的高级应用
|
5天前
|
数据采集 数据可视化 数据挖掘
使用Python进行数据处理与可视化——以气温数据分析为例
【10月更文挑战第12天】使用Python进行数据处理与可视化——以气温数据分析为例
56 0