Python数据可视化-----生成数据二

简介: Python数据可视化-----生成数据二

使用Plotly模拟掷骰子:

安装Plotly:

在终端输入pip install plotly直接进行安装

要想模拟掷骰子,我们就必须先创建一个关于骰子的类。

创建Die类:

language_survey.py

from random import randint#导入随机数的库
class Die:#创建一个表示骰子的类
    def __init__(self,num_sides=6):#设置骰子的属性,为六面骰子
        self.num_sides=num_sides
    def roll(self):
        return randint(1,self.num_sides)#返回一个1-6范围内的随机数

掷骰子:

代码如下:

project1.py

from language_survey import Die#导入我们在另一个文件中所写的关于骰子的类
die=Die()#使用实例调用
results=[]#将产生的不同结果存储在一个列表中
for roll_num in range(100):
    result=die.roll()
    results.append(result)
print(results)
[6, 6, 3, 5, 6, 3, 3, 3, 4, 6, 6, 5, 3, 5, 5, 6, 2, 3, 6, 4, 4, 6, 5, 
5, 3, 6, 3, 3, 2, 3, 5, 4, 6, 2, 5, 3, 4, 1, 5, 3, 4, 6, 6, 4, 4, 2, 
4, 2, 5, 4, 4, 1, 3, 5, 1, 3, 5, 2, 4, 5, 6, 1, 1, 4, 4, 6, 5, 3, 6,
 5, 6, 5, 3, 1, 6, 4, 1, 5, 6, 1, 1, 3, 5, 6, 3, 4, 5, 4, 2, 5, 6, 4, 
 1, 5, 1, 1, 6, 2, 6, 2]

输出结果似乎是没有问题的,输出的数字范围都在0-6之间。

如果我们想记录投掷N次之后,某个点出现的次数而不需要具体的结果呢?

,很简单,我们可以通过再创建一个空列表用于存放投掷的某个点出现的次数。


对上述实例增加如下代码:

frequencies=[]
for value in range(1,die.num_sides+1):
    frequency=results.count(value)
    frequencies.append(frequency)
print(frequencies)
[15, 10, 23, 12, 17, 23]

绘制直方图:

直方图是一种条形图,指出了各种结果出现的频率,创建这种直方图的代码如下:

#对结果进行可视化
x_values=list(range(1,die.num_sides+1))#将可能出现的点数存储在名为x_values的列表中
#注:Plotly不能直接接受函数range()的结果,因此需要使用函数list将其转换为列表
data=[Bar(x=x_values,y=frequencies)]#Bar()表示用于绘制条形图的数据集,需要一个存储x值得列表和一个存储y值的列表
#注:Plotly类必须放在方括号内,因为数据集可能包括多个元素
#对横轴和纵轴设置标签
x_axis_config={'title':'结果'}
y_axis_cofig={'title':"结果的频率"}
#类Layout()对图表的布局和标题进行设置
my_layout=Layout(title="掷一个六面的骰子1000次的结果:",xaxis=x_axis_config,yaxis=y_axis_cofig)
#调用offline.plot()的作用为了生成图表
#offline.plot()函数需要一个包含数据和布局对象的字典,并且还需要传入一个文件名,此后会将该图表放入该文件中
offline.plot({'data':data,'layout':my_layout},filename='d6.html')
print(frequencies)

运行程序后:

输出端结果:

[10, 20, 15, 17, 20, 18]

自动跳转至浏览器,呈现如下图所示的直方图:

注意,Plotly使该图表具有交互性,该交互性体现在我们将鼠标指向其中的任意条形,就能看到与之相关联的数据。

还有不要忽视了左上角的这些图标,它也有许多实际性的作用,比如可以帮助我们缩放平移和保存图像。

同时掷两个面数相同的骰子:

前面我们学习了投掷一个骰子就需要创建与其相关的类,现在我们也需要给第二个骰子创建属于它的类,每次投掷时都将两个骰子的点数进行相加,并将其存储在results中。

其需要修改的代码如下:

---snip---
die_2=Die()#创建属于第二个骰子的类
results=[]
for roll_num in range(100):
    result=die_1.roll()+die_2.roll()#返回的结果为两个骰子点数和
    results.append(result)
frequencies=[]
max_result=die_1.num_sides+die_2.num_sides#最大点数之和
for value in range(2,max_result+1):#点数之和的可能值
    frequency=results.count(value)
    frequencies.append(frequency)
x_values=list(range(2,max_result+1))
data=[Bar(x=x_values,y=frequencies)]
x_axis_config={'title':'结果',"dtick":1}#ditick的作用:指定x轴显示的刻度间距
y_axis_cofig={'title':"结果的频率"}
my_layout=Layout(title="掷一个六面的骰子100次的结果:",xaxis=x_axis_config,yaxis=y_axis_cofig)
offline.plot({'data':data,'layout':my_layout},filename='d6_d6.html')
print(frequencies)

运行之后结果为:

输出端结果:

[7, 3, 8, 11, 9, 16, 17, 14, 6, 5, 4]

自动跳转至浏览器,呈现如下图所示的直方图:

同时投掷两个面数不同的骰子:

只需要在创建新的类的时候传递参数为10,将默认值6覆盖,然后将骰子投掷的次数范围改变。

代码如下:

from plotly.graph_objs import Bar,Layout
from plotly import offline
from language_survey import Die
die_1=Die()
die_2=Die(10)#创建10面的骰子
results=[]
for roll_num in range(50_000):#改变投掷次数
    result=die_1.roll()+die_2.roll()
    results.append(result)
frequencies=[]
max_result=die_1.num_sides+die_2.num_sides
for value in range(2,max_result+1):
    frequency=results.count(value)
    frequencies.append(frequency)
x_values=list(range(2,max_result+1))
data=[Bar(x=x_values,y=frequencies)]
x_axis_config={'title':'结果',"dtick":1}
y_axis_cofig={'title':"结果的频率"}
my_layout=Layout(title="掷一个六面和十面的骰子50_000次的结果:",xaxis=x_axis_config,yaxis=y_axis_cofig)
offline.plot({'data':data,'layout':my_layout},filename='d6_d10.html')
print(frequencies)

运行之后结果为:

输出端结果:

[816, 1676, 2568, 3351, 4217, 5061, 4977, 5041, 4870, 5043, 4167, 3309, 2432, 1671, 80

自动跳转至浏览器,呈现如下图所示的直方图:

相关文章
|
10天前
|
数据可视化 数据挖掘 定位技术
Python和Geopandas进行地理数据可视化
【10月更文挑战第22天】本文介绍了如何使用Python和Geopandas进行地理数据可视化和分析,涵盖从准备工作、加载数据、数据探索与处理、地理数据可视化、空间分析与查询到交互式地理数据可视化等内容。通过丰富的代码示例和案例演示,帮助读者掌握地理数据分析的基本方法,为实际应用提供支持。
49 19
|
6天前
|
移动开发 数据可视化 数据挖掘
利用Python实现数据可视化:以Matplotlib和Seaborn为例
【10月更文挑战第37天】本文旨在引导读者理解并掌握使用Python进行数据可视化的基本方法。通过深入浅出的介绍,我们将探索如何使用两个流行的库——Matplotlib和Seaborn,来创建引人入胜的图表。文章将通过具体示例展示如何从简单的图表开始,逐步过渡到更复杂的可视化技术,帮助初学者构建起强大的数据呈现能力。
|
24天前
|
数据采集 JSON 数据处理
抓取和分析JSON数据:使用Python构建数据处理管道
在大数据时代,电商网站如亚马逊、京东等成为数据采集的重要来源。本文介绍如何使用Python结合代理IP、多线程等技术,高效、隐秘地抓取并处理电商网站的JSON数据。通过爬虫代理服务,模拟真实用户行为,提升抓取效率和稳定性。示例代码展示了如何抓取亚马逊商品信息并进行解析。
抓取和分析JSON数据:使用Python构建数据处理管道
|
9天前
|
图形学 Python
SciPy 空间数据2
凸包(Convex Hull)是计算几何中的概念,指包含给定点集的所有凸集的交集。可以通过 `ConvexHull()` 方法创建凸包。示例代码展示了如何使用 `scipy` 库和 `matplotlib` 绘制给定点集的凸包。
19 1
|
10天前
|
JSON 数据格式 索引
Python中序列化/反序列化JSON格式的数据
【11月更文挑战第4天】本文介绍了 Python 中使用 `json` 模块进行序列化和反序列化的操作。序列化是指将 Python 对象(如字典、列表)转换为 JSON 字符串,主要使用 `json.dumps` 方法。示例包括基本的字典和列表序列化,以及自定义类的序列化。反序列化则是将 JSON 字符串转换回 Python 对象,使用 `json.loads` 方法。文中还提供了具体的代码示例,展示了如何处理不同类型的 Python 对象。
|
10天前
|
数据采集 Web App开发 iOS开发
如何使用 Python 语言的正则表达式进行网页数据的爬取?
使用 Python 进行网页数据爬取的步骤包括:1. 安装必要库(requests、re、bs4);2. 发送 HTTP 请求获取网页内容;3. 使用正则表达式提取数据;4. 数据清洗和处理;5. 循环遍历多个页面。通过这些步骤,可以高效地从网页中提取所需信息。
|
21天前
|
数据可视化 数据挖掘 Python
使用Python进行数据可视化:探索与实践
【10月更文挑战第21天】本文旨在通过Python编程,介绍如何利用数据可视化技术来揭示数据背后的信息和趋势。我们将从基础的图表创建开始,逐步深入到高级可视化技巧,包括交互式图表和动态展示。文章将引导读者理解不同图表类型适用的场景,并教授如何使用流行的库如Matplotlib和Seaborn来制作美观且具有洞察力的可视化作品。
44 7
|
21天前
|
数据可视化 定位技术 Python
使用Python进行数据可视化
【10月更文挑战第22天】在这篇文章中,我们将深入探讨如何使用Python进行数据可视化。我们将从基础的图表开始,然后逐步进入更复杂的可视化技术。我们将通过实例代码来展示如何实现这些可视化,以便读者能够更好地理解和应用这些技术。
20 5
|
22天前
|
数据可视化 Python
使用Python进行数据可视化的初学者指南
【10月更文挑战第20天】本文旨在为编程新手提供一个简洁明了的入门指南,通过Python语言实现数据可视化。我们会介绍如何安装必要的库、理解数据结构,并利用这些知识来创建基本图表。文章将用通俗易懂的语言和示例代码,帮助读者快速掌握数据可视化的基础技能。
30 4
|
23天前
|
数据可视化 算法 JavaScript
基于图论的时间序列数据平稳性与连通性分析:利用图形、数学和 Python 揭示时间序列数据中的隐藏模式
本文探讨了如何利用图论分析时间序列数据的平稳性和连通性。通过将时间序列数据转换为图结构,计算片段间的相似性,并构建连通图,可以揭示数据中的隐藏模式。文章介绍了平稳性的概念,提出了基于图的平稳性度量,并展示了图分区在可视化平稳性中的应用。此外,还模拟了不同平稳性和非平稳性程度的信号,分析了图度量的变化,为时间序列数据分析提供了新视角。
51 0
基于图论的时间序列数据平稳性与连通性分析:利用图形、数学和 Python 揭示时间序列数据中的隐藏模式