多项分布模拟及 Seaborn 可视化教程-阿里云开发者社区

多项分布模拟及 Seaborn 可视化教程

2024-06-03 282

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 多项分布是二项分布的推广，描述了在n次试验中k种不同事件出现次数的概率分布。参数包括试验次数n、结果概率列表pvals（和为1）和输出形状size。PMF公式展示了各结果出现次数的概率。NumPy的`random.multinomial()`可生成多项分布数据。练习包括模拟掷骰子和抽奖活动。解决方案提供了相关图表绘制代码。关注公众号“Let us Coding”获取更多内容。

多项分布

简介

多项分布是二项分布的推广，它描述了在 n 次独立试验中，k 种不同事件分别出现次数的离散概率分布。与二项分布只能有两种结果（例如成功/失败）不同，多项分布可以有 k 种（k ≥ 2）及以上的不同结果。

参数

多项分布用三个参数来定义：

n：试验次数，表示重复相同实验的次数。
pvals：一个长度为 k 的列表，其中每个元素表示对应结果出现的概率。pvals 的元素之和必须为 1。
size：输出数组的形状。

公式

多项分布的概率质量函数 (PMF) 给出了在 n 次试验中，k 种结果分别出现 k1、k2、...、kk 次的概率，计算公式为：

P(k1, k2, ..., kk) = n! / (k1! * k2! * ... * kk!) * (p1 ^ k1) * (p2 ^ k2) * ... * (pk ^ kk)

其中：

P(k1, k2, ..., kk)：表示 k 种结果分别出现 k1、k2、...、kk 次的概率。
n!：n 的阶乘，即 n × (n - 1) × (n - 2) × ... × 2 × 1。
k1!、k2!、...、kk!：k1、k2、...、kk 的阶乘，分别表示对应结果出现的次数的阶乘。
p1、p2、...、pk：对应结果出现的概率，分别为 pvals 列表中的元素。

生成多项分布数据

NumPy 提供了 random.multinomial() 函数来生成服从多项分布的随机数。该函数接受以下参数：

n：试验次数。
pvals：结果的概率列表。
size：输出数组的形状。

示例：生成掷骰子 10 次的结果，其中每个结果出现的概率相等：

import numpy as np

data = np.random.multinomial(n=10, pvals=[1/6] 6, size=1000)
print(data)

可视化多项分布

由于多项分布可以表示多种结果的出现次数，因此其可视化方式通常取决于结果的个数和想要展示的信息。

条形图：如果结果个数较少，可以使用条形图来直观地显示每个结果出现的次数。
堆积条形图：如果结果个数较多，可以使用堆积条形图来显示不同试验次数下每个结果出现的次数分布。
折线图：如果需要比较不同试验次数下每个结果出现的概率分布，可以使用折线图来绘制每个结果出现的概率随试验次数的变化情况。

练习

模拟 100 次掷骰子的结果，并绘制每个结果出现的次数分布图。
比较不同试验次数下掷骰子结果的分布变化。
模拟一个具有 3 种结果的抽奖活动，每个结果出现的概率分别为 1/3、1/2 和 1/6，并计算每种结果出现 1 次的概率。

解决方案

import seaborn as sns
import numpy as np
import matplotlib.pyplot as plt

# 1. 模拟掷骰子结果并绘制分布图
data = np.random.multinomial(n=10, pvals=[1/6] 6, size=1000)
result_counts = data.sum(axis=0)  # 计算每个结果出现的总次数
sns.barplot(x=np.arange(len(result_counts)), y=result_counts)
plt.xlabel("Result")
plt.ylabel("Count")
plt.title("Distribution of Dice Rolls (1000 trials)")
plt.show()

# 2. 比较不同试验次数下分布变化
n_values = [10, 50, 100, 500]
for n in n_values:
    data = np.random.multinomial(n=n, pvals=[1/6] 6, size=1000)
    result_counts = data.sum(axis=0)
    sns.barplot(x=np.arange(len))

最后

为了方便其他设备和平台的小伙伴观看往期文章：

微信公众号搜索：Let us Coding，关注后即可获取最新文章推送

看完如果觉得有帮助，欢迎点赞、收藏、关注

多项分布模拟及 Seaborn 可视化教程

多项分布

简介

参数

公式

生成多项分布数据

可视化多项分布

练习

解决方案

最后

云原生

热门文章

最新文章

相关课程

相关电子书

推荐镜像