统计学基石——概率和概率分布

统计学基石——概率和概率分布

如果觉得文章对你有用,欢迎关注、转发、点赞、收藏。

概率与概率分布是统计学中的基础概念,在我们的高中的课本中就接触过了,如果有遗忘,一起来回顾一下吧!

知识点:

  • 概率
  • 概率分布


一、概率

说到概率,需要先了解一个概念,叫做随机试验。随机试验是指在相同条件下对某随机现象进行的大量重复观测的试验,需满足以下三个条件:

(1)在相同的条件下重复进行;

(2)事先知道可能发生的所有结果,而且结果不止一个;

(3)每一次试验都不能知道会是结果中的哪一个。

随机事件是在随机试验中产生的,可能出现也可能不出现,而在大量重复试验中具有某种规律性的事件。

概率是对随机事件发生的结果可能性大小的客观度量。取值在0到1之间,也可以表示为百分数0%到100%之间。如果一个事件发生的概率为0,则称这个事件为不可能事件;如果一个事件发生的概率为1,则称这个事件为必然事件;如果一个事件发生的概率在0-1之间,那么这个事件则不一定发生,概率越靠近1,发生的可能性越大。


示例:多次抛掷均匀的硬币,记录正反面。在试验次数越大的情况下,结果为正面的概率越接近50%。

二、概率分布

概率分布是指事件的不同结果对应发生的概率所构成的分布,体现在坐标轴上,能直观的看出事件全部可能的结果及其发生的概率大小。根据数据连续型,数据集可以分为连续型和离散型,对应事件的结果,其概率分布也可以分为连续型概率分布和离散型规律分布。


统计学基石——概率和概率分布


如上图中离散型概率分布图所示,离散型概率分布是由若干垂直于x轴的柱形组成。柱形与x轴的交点表示可能发生的结果,顶端对应y轴的值表示该结果发生的概率。常见的离散型概率分布包括几何分布、二项分布和泊松分布等。

如上图中连续型概率分布图所示,因为事件的结果可以在x轴上的任意一点取值,所以连续型概率分布是一条连续的曲线。与离散型概率分布不同,表示连续型概率分布的概率为概率密度,只有取x轴的一段区间,才能得到对应事件发生的概率。即对x1-x2的区间,对应的概率为该区间曲线下方面积的积分。常见的连续型概率分布包括正态分布、均匀分布等。

本原创首发于公众号:数据分析鱼,欢迎围观!


分享到:


相關文章: