此页内容
stats

超几何分布和二项分布

Jeason

580字约2分钟

stats

2019-02-21

超几何分布

超几何分布是统计学上一种离散概率分布。它描述了由有限个物件中抽出nn个物件,成功抽出指定种类的物件的个数的概率(不归还)。

黑白球问题解释:例如共有NN个球,其中mm个白球。超几何分布描述了在该NN个球中抽出nn个,其中kk个是白球的机率:

f(k;n,m,N)=(mk)(Nmnk)(Nn) f(k;n,m,N) = \frac{\binom{m} {k} \binom {N-m} {n-k}} {\binom {N} {n}}

上式可如此理解:

(Nn)\left( N \over n\right)表示所有在NN个样本中抽出nn个,而抽出的结果不一样的数目。

(mk)\left(m \over k\right)表示在mm个样本中,抽出kk个的方法数目。剩下来的样本都是及格的,而及格的样本有NmN-m个,剩下的抽法便有(Nmnk)\left({N-m} \over {n-k}\right)种。

n=1n=1,超几何分布还原为伯努利分布。若NN接近 \infty,超几何分布可视为二项分布

二项分布

在概率论和统计学中,二项分布(英语:Binomial distribution)是n个独立的是/非试验中成功的次数的离散概率分布,其中每次试验的成功概率为pp。这样的单次成功/失败试验又称为伯努利试验。实际上,当n=1n=1时,二项分布就是伯努利分布。

具体解释:

假设进行nn次独立实验,每次实验“成功”的概率为pp,失败的概率为1p1-p,所有成功的次数X就是一个参数为nnpp的二项随机变量.数学公式定义为:

p(k)=(nk)pk(1p)nk p(k) = \binom {n} {k} * p^k * (1-p)^{n-k}

二项分布公式基于伯努利分布得到,因为二项分布中每项实验都是独立的,因此每一次实验都是一次伯努利实验,在nn次实验中,成功kk次,排列方式有(nk)\left( {n \over k} \right)种,根据乘法原理,即可得到二项分布的公式。

总结

超几何分布相当于连续抽取nn次成功的概率(不放回抽样),二项分布是重复抽nn次成功的概率(放回抽样)。