浅析概率论的应用

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 浅析概率论的应用【摘 要】在学习概率论与数理统计过程中,我们可以发现随机现象存在于我们日常生活的方方面面和科学技术的各个领域。并且概率论与数理统计不仅是一门十分重要的大学数学基础课, 还是唯一一门研究随机现象规律的学科,它指导人们从事物表

浅析概率论的应用

【摘 要】在学习概率论与数理统计过程中,我们可以发现随机现象存在于我们日常生活的方方面面和科学技术的各个领域。并且概率论与数理统计不仅是一门十分重要的大学数学基础课, 还是唯一一门研究随机现象规律的学科,它指导人们从事物表象看到其本质。而且概率论与数理统计在自然科学、日常生活、工程技术、经济、管理、军事和工农业生产等领域都有应用。

在社会不断进步和科学不断发展中,学科本身的理论和方法日渐成熟,近年来,概率统计知识也越来越多的渗透到教育学中:诸如物理学、遗传学、信息论等学科当中,可以培养学生善于思考、用数学知识分析问题和解决问题的能力,也有助于学生数学建模能力的构建,以期为社会培养更多的应用型数学人才。另外,在日常生活中也有很多案例蕴含着概率论的相关知识,如概率论在赌博、彩票、保险三个方面都有很重要的应用。21世纪以来,互联网的快速发展与推广使数据呈现几何倍数的增长,这使我国迎来了大数据时代由于大数据具备规模大、增长快、稀疏性等特征,这也给大数据分析带来较大困难在大数据时代,利用概率论与数理统计方法来对繁杂数据进行分析与挖掘不失为是一种简单高效的方法。所以,本文便对概率论与数理统计方法在教育学中、日常生活中和大数据分析中等的相关应用策略进行浅析。

【关键词】概率论;数理统计;大数据;日常生活;教育学

A brief analysis of the application of probability theory

AbstractIn the process of learning probability theory and mathematical statistics, we can find that random phenomena exist in every aspect of our daily life and every field of science and technology. Besides, probability theory and mathematical statistics are not only a very important basic course of university mathematics, but also the only discipline that studies the law of random phenomena, which guides people to see the essence of things from their appearance. Moreover, probability theory and mathematical statistics are applied in natural science, daily life, engineering technology, economy, management, military and industrial and agricultural production.

 In social progress and science development, the theory and method of the subject itself increasingly mature, in recent years, the probability and statistics knowledge also more and more to infiltrate the pedagogy: subjects such as physics, genetics, information theory, can cultivate students' thinking and to use mathematical knowledge to analyze and solve problem ability, also helps to build students' ability of mathematical modeling, in order to train more applied mathematical talents for the society. In addition, there are also a lot of cases in daily life containing the relevant knowledge of probability theory, such as probability theory in gambling, lottery, insurance are very important applications. Since the 21st century, the rapid development of Internet and promotion data brings multiple geometric growth, which ushered in the era of big data in China because of the large data with large size and fast growth, sparse characteristics, it also bring greater difficulties for big data analysis in the era of big data, using the method of probability and mathematical statistics to analyze the complex data and mining is a kind of simple and efficient method. Therefore, this paper analyzes the application strategies of probability theory and mathematical statistics in pedagogy, daily life and big data analysis.

Key wordsProbability theory;Mathematical statistics;Big data;Daily life;Pedagogy

 

一、概率论的历史和发展

   最初的概率论起源于赌博问题,在十五世纪,意大利的数学家塔塔利亚和帕乔利等人都讨论过两个人之间的赌金分配问题,概率论最早的著作是由荷兰数学家惠更斯撰写的《论赌博的计算》,而这本著作也是当时概率论方面的最高著作,这也标志着概率论的诞生,而概率论学科中的真正奠基人便是伯努利家族的雅克布伯努利,他在著作《猜度术》中提出了以“伯努利定理”著称的极限定理,而这个定理在这之后的概率学发展中占据了重要的地位。而在伯努利之后,法国的数学家棣莫弗在之前的概率论基础上提出了正态分布,以及概率乘法等规则,之后拉普拉斯,高斯等人都对概率论做出了进一步地深入研究工作,而拉普拉斯在他的著作《概率的分析理论》中以很强的分析工具来对概率论问题进行处理。正是在这部著作中,他给出了古典化模型的定义,事件发生的概率等于该事件可能出现的所有结果数和试验中可能的所有结果数之比。概率学再往后发展,便到了极限理论。俄国的数学家切比雪夫建立了关于独立随机变量的大数定律,而在这其中,泊松大数定律和伯努利定理变成了大数定律的特例。

二、日常生活与概率论

(一)在博彩方面的应用

   我们采用对于国内最常见的福利彩票——双色球玩法进行概率学分析,其中双色球两块钱一注,每注包括6个红色号码球和1个蓝色号码球,其中红色号码球的范围实在1-33,蓝色号码球的范围是在1-16,而对于双色球的奖金设置,彩票公司将奖金设置为彩票销售额的50%,并且对于每注获得的奖项进行分级,分别包括一等奖,二等奖一直到六等奖,而其中一等奖,二等奖属于高等奖项,其余的属于低等奖,高等奖的奖金采用浮动制,而低等奖的奖金采用固定制,当期高等奖金的金额等于当期的奖金(销售额*50%)减去当期低等降级你的金额,而具体的中奖规则和奖金分布可以被详细的描述为:

a.一等奖:中奖规则是抽中6个红色球和1个蓝色球,奖金大约为当期高等奖金的70%。

对应的概率为:

 

b.二等奖:中奖规则是抽中6个红色球,奖金大约是当期高等奖金的30%。

对应的中奖概率为:

 

c.三等奖:中奖规则是抽中5个红色球和1个蓝色球,奖金为每一注3000元。

对应的中奖概率为:

 

d.四等奖,中奖规则是抽中5个红色球或者是4个红色球和1个蓝色球,奖金为每一注200元。

对应的中奖概率为:

 

   e.五等奖:中奖规则是抽中4个红色球或者是3个红色球和1个蓝色球,奖金为每一注10元。

对应的中奖概率:

 

f.六等奖:中奖规则是抽中1个蓝色球(可以抽中2个,1个或者没有抽中红色球)。

对应的中奖概率:

 

而对应的不中奖概率为:

 

对于上述问题,我们采用古典概型来计算不同奖项出现的概率,因为每一种奖项出现的结果都是有限个,并且每一个结果发生的可能性都是相同。

(二)贝叶斯公式在医疗中的应用

   据调查,在自然人群中,人们患某病的概率为0.5%。在身体没有不舒服的前提下,去医院检查是否患此病,其准确率为95%。那么当试验反应是阳性时,被诊断者患有这种病的概率是多少?

解:设A表示“试验反应为阳性”,B表示“被诊断者患病”由题可知P(B)=0.005,P(A/B)=0.95,则

 

因此被诊断者患有这种病的概率是0.0872。

(三)在产品检测中的应用

例:某公司生产一批产品,共有 100 件,但其中有 10 件是不合格品。根据验收规则,要从中任取 5 件产品来进行质量检验,假如 5 件中没有不合格品,则这批产品可被接受,否则就要重新对这批产品进行逐个检验。

(1)试求这 5 件产品不合格品数 X 的分布列;

(2)需要对这批产品进行逐个检验的概率是多少?

   解:(1)这 5 件产品中不合格品数 X 的全部可能取值0,1,2,3,4,5 ,

则  ,

,

,

,

,

,

 故 X 的分布列为

X

0

1

2

3

4

5

P

0.583752

0.339391

0.070219

0.006384

0.000251

0.000003

(2)所求概率为 :  

(四)概率论在农业中的应用之区间估计的应用

我们知道,参数的点估计给出的是一个具体的数值,它虽然便于使用与计算,但并不能反映出精度,故而精度一般是由其分布来反映。而经验表明,区间是度量精度的最直观方法之一,这就产生了区间估计的概念。下面的播种问题就是其在实际生活中应用的例子。

例:科学家为了对两种大豆的产量做比较,用相同的耕种方法,在有相似条件的 18 块试验田上做试验,甲乙两品种播种的田数分别为: 8 和 10 ,且试验田中,这两种大豆在单位面积上的产量( kg )分别为

品种甲: 628 583 510 554 612 523 530 615

品种乙: 535 433 398 470 567 480 498 560 503 426

若这两个品种的大豆在单位面积上的产量都是服从正态分布的,请给出这两个大豆品种的平均单位面积产量差的置信区间  。

解 :将品种甲的单位面积产量记作  , 品种乙的单位面积产量记作  ,

由此计算可得    ,  ,  ,

    ,  ,  ,

在下面两种情况下讨论。

(1)若这两个品种有相等的单位面积产量的标准差,显然在此处可以用二样本 t 区间来处理。从而有

  ,

  ,

 故而  的  置信区间为

(2)若这两个品种有不等的单位面积产量的方差,显然在此处可以用近似 t 区间来处理。从而有

,  ,

,

故而  的  近视置信区间为

 

概率论知识起源于生活,反过来又指导和影响着我们的生活。充分利用概率论知识与生活的紧密联系,结合生活中的有关案例,有助于我们的日常教学。将有趣且与知识点相关的例子应用于课堂教学,能激发学生的学习兴趣,培养学生善于思考、分析问题和解决问题的能力,也有助于学生数学建模能力的构建,以期为社会培养更多应用型的数学人才。

三、教育学中的概率论之在高等数学中的应用

   高等数学是众多学科中难度最大的一门。所以在高等数学的解题过程中,如果只是按照传统的解题方法进行解题,不仅解题过程会很复杂烦琐,而且最终得到的答案也不一定会准确。所以在解高等数学的题目时,应该将概率论的知识充分地应用到其中,这样不仅能够快速解题,还能够大大地提高准确率。概率论在不同的高等数学题目中的应用不同,下面为学生提供几个常见的解题

思路。

   (一)概率思想在高等数学化简问题中的应用

选择一些数字,这些数字都确定在一定范围中,然后把这些数字视为一个事件所发生的概率,然后利用概率的分布,对问题进行解决,在应用的过程中也可以使用泊松分布性质来解决问题。这种计算方式不仅可以将原本复杂的步骤简化,还能够提高计算结果的准确性。在高等数学化简问题中,概率论的思想的应用,可以将概率论的思想和化简问题进行练习,在将问题变得简单的同时还能够激发学生对“概率和数理统计”知识产生学习兴趣。为了方便理解,用下面这个具体的例子来将概率思想在化简问题中的应用进行展示。

例:有这样100盏灯,将这些灯进行编号,编号按照阿拉伯数字进行排序,因为灯的开关属于闸开关,现将这些灯的开关都打开,确保所有的灯都保持亮的状态,然后在将所有的开关都关闭,确保所有开关关闭之后,然后,开始将编号为2的倍数的全部灯的开关都打开,然后将3的倍数的灯全部打开,依次循环操作,最终将100倍数的灯都打开。

(二)概率思想在高等数学积分中的应用

   据有效数据实验表示,概率论的思想在高等数学积分中也能够有着较高的应用机制,不仅可以将原本复杂的积分问题简化,还能够使得结果变得相对准确。概率论的思想在高等数学积分中的应用,是在结合式子本身的性质下,在经过一些变形之后,将原本复杂的积分问题变化为概率密度函数,这样在利用概率密度函数相关性质后,可以将问题进行解决,这也被称为归一性,通过变

形,将积分函数中的一部分变成1,这样整个函数就变得简单了,在进行计算时,就会变得简单。

比如:计算    

解:设连续型随机变量:     其概率密度为:

 

此时,利用概率密度归一性可得:

 

所以,

   (三)利用正态分布解决一类反常积分问题

   在高等数学解题过程中,应用概率论方法,可以通过应用正态分布的方式来解决一类反常积分问题。在计算一些积分问题的过程中,如果采用二重积分的极坐标变换方法进行解答,会提高问题的难度,且解决起来也会比较困难。而应用概率论方法中的正态分布方法,会大大降低一类反常积分的解决难

度,也会让解题效果和效率达到事半功倍的效果。

例如,在计算伯松积分时,利用N(0,1)的密度函数得出,那么,

   在此过程中,采用二重积分的极坐标变换方法求解,会提升问题的难度。而利用正态分布解决一类反常积分问题,可以拓展到形如的计算。其中,为多项式函数,在一定程度上使这类反常积分问题的难度得以降低。此时,结合分部积分法或者正态分布期望的公式进行求解,进而有效地简化一类反常积分问题的计算步骤,避免步骤错误,能让学生在解决的过程中更容易理解、不易犯错,促使学生高等数学解题效率与质量全面提高。

概率论在高等数学中还有一些应用,例如:利用概率论解决随机变量数学期望和方差关系;利用概率论解决二重积分计算问题等。

   在高等数学教育改革过程中,教师要不断革新教学手段。不仅如此,教师还应该通过挖掘教材内容,科学训练学生数学思维,提高学生综合数学能力提升。概率论在高等数学教学中的应用,可以有效提高学生的数学解题能力,借助教师的科学引导和帮助,学生数学思维会更加完善。首先分析了概率论的基本内容,并结合概率论对其在高等数学解题中的应用进行了分析,旨在助力于高等数学教育水平不断提升。

三、概率论与数理统计在大数据分析中的应用

如今,人们对大数据的分析需求越来越迫切,这也使人们急需一种能够适用于大数据分析的有效方法来解决实际生产生活中的复杂问题。鉴于此,以下便对概率论与数理统计在大数据分析中的相关应用策略进行探讨,希望能为人们在生产生活中的大数据分析提供相应的参考建议。

   大数据时代的来临,使人们能够利用概率论与数理统计来对大数据进行分析,这也使其和大数据分析具备着密切的联系,其联系主要集中在以下四个方面,首先,概率论与数理统计和大数据分析的研究目标是相同的,都是为了对数据结构进行探索与明确,以此找出大数据的内部联系与规律。其次,大数据的不断发展,使大数据分析为统计学开拓出了一个新的应用空间,这也为概率论与数理统计的研究提供了一个全新的课题,通过对大数据的分析,能够极大程度的推动概率论与数理统计的发展。再次,大数据分析并不属于统计学中的一种分支,大数据分析还能够广泛应用于其他领域当中,能够为其他领域提供新的思想、工具与方法,例如利用大数据分析可以使机器进行学习,并能够实现数据存储等。最后,概率论与数理统计是DM中一种应用非常广泛而又较为成熟的解决问题方法与技术,其在DM中占据着极为重要的地位。

   (一)概率论与数理统计在经济数据分析中的应用

   在大数据时代,数据对于经济的作用是不言而喻的,而在各种类型的数据当中,经济数据是最为常见的类型,对这些经济数据的分析对于推动社会经济发展具有着十分重要的意义。由于经济数据在互联网中是以低密度形式存在的,这也给人们对经济数据的分析带来较大的难度 。而利用概率论与数理统计来对经济数据进行分析,则不失为一种简单而有效的方法。例如,利用正态概率分布方法来对经济数据分析,该方法能够对连续性随机变量的概率进行预测与描述, 而这种概率方法也被普遍应用到经济金融管理领域当中。利用该方法能够使人们能过概率论与数理统计来对概率的所有相关信息进行快速而又高效的分析,并按照分析结果来对市场经济状况进行实时掌握,使人们能够了解市 场经济规律,并从中分析出更多的经济信息,通过这些信息的帮助来对后续的决策与计划进行灵活的制定与调整。经济市场是变幻莫测的,但在变化上却不会过于离谱,而对经济数据的分析除了要对经济市场的变化规律及发展趋势进行预测,还要考虑经济市场中的风险性,风险的存在是利益的获取并不总是一成不变的,但通过对经济数据的分析能够找出相应的应对措施来避免这些问题。对于经济风险来说,要想避免经济风险的产生,利用概率论与数理统计能够有效降低经济风险的发生概率,而这也是人们最常采用的应对方法。以股票投资为例,利用概率论与数理统计方法来对经济数据进行分析,可以显而易见的看出投资股票的数量越多,则利润的产生概率要比投资股票数量少的要高的多,而这正是通过概率论与数理统计方法得到的。因此,在投资决策中,更多的投资者往往会将资金散到更多的股票当中来降低风险,而这就使投资者的利润获得概率大大提高,由此可见,概率论与数理统计在经济数据分析中具有显著的作用。

   (二)概率论与数理统计在商业数据分析中的应用

   在大数据环境中,商业数据对于企业的重要性是不言而喻的,商业数据与经济数据存在一定的联系,商业数据属于经济数据的一种,但经济数据却不一定是商业数据。企业在对商业数据进行分析时,概率论与数理统计是最为常用的一种方法。以商业数据中的大客户流失概率为例来对概率论与数理统计在商业数据中的应用策略进行探讨。首先需要建立研究模型,在模型建立时需要确保满足以下条件,其一是大客户的基本属性应当是相近的,并且流失数据能够满足相同的流失函数。其二是流失数据的分布条件均来自于流失函数指数项。然后找出哪些因素给大客户的流失概率造成较大影响,对数据进行归类并设定特定时段,之后对特定情况中的大客户流失情况进行汇总,并获得流失情况走势图,然后计算出走势图的标准函数,即,进而获得某个确定客户在某一时间中的流失概率与所在流失函数中的位置,客户在[O,T]时期内的流失概率为p=  ,p维回归参数的向量为c和p,维协变量向量为,并将该协变量当作一种影响因素进行定义,进而完成研究模型的构建。其次,在研究模型建立后,便要选择参数与协变量,然后通过最大偏似然函数对这些选择的回归参数进行计算。由于计算过程中对于大客户流失的影响因素有多个,如果将所有因素全部定义成协变量,则会使模型维数更多,进而使参数估计难度大大提升,这也使参数的估计正确率无法得到保证。因此,需要对这些因素进行选择性使用,为了对协变量的数量进行确定,应按照数理统计结果进行筛选,这样才能避免错误的产生。

现如今,概率论与数理统计在大数据分析中已经不再是一种辅助分析工具,更是一个简单而又高效的分析方法。通过概率论与数理统计的应用,对于大数据中各类数据的过程、趋势、效果等都已经成为人们进行数据分析时的分析对象。面对大数据的高速增长趋势,应用概率论与数理统计来进行大数据分析,将更有助于推动人们生产生活的发展,促进我国经济的快速增长。

结束语:

   作为一门数学学科,概率论涉及许多专业理论知识,甚至可以说比较深奥,不过概率论在生活中的应用确实非常广泛。例如在日常的生活中,人们总是会遇到各种各样的抽奖活动。有些抽奖活动的奖品非常诱人,但是存在着很大的欺骗性,如果顾客不懂其中的概率问题,被表面条件和奖品所蒙蔽,就极有可能上当受骗。而且概率论在别的领域也都有应用,特别是在大数据领域正在加强运用。

参考文献:

[1]吴赣昌.概率论与数理统计[M].北京:中国人民大学出版社,2011.

[2]王志超.摇出的彩票中奖号码随机吗?[J].高等数学研究,2004(5).

[3]丁李.几种重要概率分布在高等数学解题中的应用[J]阴山学刊(自然科学版),2018,32(04):78-80.

[4]常会敏.概率论在生活中的应用举例[J].河北广播电视大学学报,2020,25 (01):106-108.

[5]张欣悦.概率论在生活中的应用[J].造纸装备及材料,2020,49(01):256.

[6]赵存秀.概率论与数理统计在经济生活中的应用[J].现代营销(经营版), 2020(01):62.

[7]袁继成,李少伟,郭保宏.高等数学解题过程中概率论方法的应用研究[J].科学咨询(科技·管理),2019(12):137.

[8]周永涛.高等数学知识在概率论中的应用[J].当代教育实践与教学研究,2019 (16):237-238+242.

[9]冯思越.概率论在农村生活中的应用探究[J].山西农经,2019(14):35.

[10]远巧针.高等数学解题中概率论方法的应用研究[J].智库时代,2019(14):159+166.

[11]姜权.概率论与数理统计在大数据分析中的应用策略[J].山东农业工程学院学报,2018,35(12):10-11.

 


相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
机器学习/深度学习 人工智能 算法
数学基础之概率论
数学基础之概率论
78 1
|
人工智能 资源调度 Python
概率论基础
因为概率图模型会涉及大量概率论的知识,所以在开始概率图模型之前,首先让我们回顾一下概率论的一些概念和基础知识。
155 0
概率论基础
概率论|贝叶斯公式及其推论的理解和运用
概率论|贝叶斯公式及其推论的理解和运用
186 0
|
容器
数学|泊松分酒问题蕴藏的数学知识
数学|泊松分酒问题蕴藏的数学知识
205 0
概率论笔记(二)概率分布
概率论笔记(二)概率分布
104 0
|
Dart 算法 Java
概率论与数理统计引论
概率论与数理统计引论
统计学(一)
分位数 使用QUARTILE函数算出 第一分位数:25%分位数 第二分位数:中位数 第三分位数:75%分位数 知识在于点滴积累
676 0
面向数据科学的概率论 三、随机变量
三、随机变量 原文:prob140/textbook/notebooks/ch03 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 许多数据科学涉及数值变量,它的观察值取决于几率。
680 0