超几何分布是概率统计中一个重要的离散概率分布,与二项分布不同,超几何分布的取样不是独立的,而是存在依赖关系的。它是一种非常实用的分布,通常应用于本次抽样中有限总体的实际取样情况。它的应用领域极广,一般用于质量控制、生态学,以及组合数学中。
这里简单介绍一下超几何分布的公式和计算方法。假设一个总体中有N个元素,其中k个元素具有所关心的属性,则总体中有(N-k)个元素不具有该属性。从这个总体中随机、无重复地抽取n个元素,其中具有该属性的元素的数量为X,则X的分布律为:
其中,C(k,x)为k个元素中选取x个元素的排列数,C(N-k,n-x)为(N-k)个元素中选取(n-x)个元素的排列数。超几何分布的期望和方差公式为:
需要提醒一下的是,超几何分布的样本个数比总体个数小时,它的期望值是能够被严格算出的,但方差的算法通常较为复杂,一般需要采用仿真等计算方法。