超几何分布的期望和方差公式、推导与应用详解

超几何分布是一种重要的离散概率分布，它描述了在一个有限总体中，不进行替换抽样时，抽取指定数量“成功”个体的概率。与二项分布（基于有放回抽样或无限总体抽样）不同，超几何分布中的每次抽取都不是独立的，因为总体在每次抽取后都会发生变化。了解超几何分布的期望（均值）和方差对于理解其中心趋势和离散程度至关重要。

超几何分布的期望是什么？

超几何分布的期望（Expected Value），记为 E(X)，代表了在进行 <n> 次不放回抽样后，预期抽到具有特定属性的个体（通常称为“成功”个体）的平均数量。

超几何分布的期望公式

超几何分布的期望公式非常简洁：

E(X) = n * (K / N)

这个公式直观地表示：期望的“成功”次数等于样本大小乘以总体中“成功”个体所占的比例。

公式中各符号的含义

N：总体的个体总数。
K：总体中具有特定属性的个体数量（“成功”个体数）。
n：样本的个体数量（抽样次数）。
X：样本中具有特定属性的个体数量（随机变量）。

举例来说，如果一个班级有 N=50 名学生，其中 K=20 名近视。从中随机抽取 n=10 名学生。那么预期抽到的近视学生数量就是 E(X) = 10 * (20/50) = 10 * 0.4 = 4 人。

超几何分布的方差是什么？

超几何分布的方差（Variance），记为 Var(X) 或 σ²，衡量了随机变量 X（样本中的“成功”个体数）围绕其期望值的离散程度。方差越大，样本中“成功”个体数的波动性越大。

超几何分布的方差公式

超几何分布的方差公式比期望公式稍微复杂，因为它需要考虑不放回抽样导致的总体变化：

Var(X) = n * (K / N) * ((N – K) / N) * ((N – n) / (N – 1))

方差公式的组成部分

仔细观察这个公式，你会发现它包含了几个部分：

n * (K / N) * ((N – K) / N)：这一部分实际上是与期望值 E(X) = n * p 对应的二项分布的方差公式 n * p * (1-p)，其中 p = K/N 是从总体中随机抽取一个体是“成功”的概率。
((N – n) / (N – 1))：这一部分被称为“有限总体修正系数”（Finite Population Correction Factor），它是超几何分布方差区别于二项分布方差的关键。这个系数总是小于或等于 1（当 n > 1 时），反映了不放回抽样减少了随机性，从而使得方差小于相同参数下的二项分布方差。

沿用上面的例子（N=50 学生，K=20 近视，n=10 抽样），方差计算如下：

Var(X) = 10 * (20/50) * ((50-20)/50) * ((50-10)/(50-1))

Var(X) = 10 * 0.4 * (30/50) * (40/49)

Var(X) = 10 * 0.4 * 0.6 * (40/49)

Var(X) = 2.4 * (40/49)

Var(X) ≈ 2.4 * 0.8163 ≈ 1.959

为何超几何分布的方差不同于二项分布？

这是因为两者的抽样方式不同：

二项分布：基于有放回抽样，或总体非常大以至于抽取单个个体对后续概率影响可忽略的情况。每次抽取都是独立的，成功的概率 p 保持不变。
超几何分布：基于不放回抽样。每次抽取后，总体的数量 N 和“成功”个体数量 K（如果抽到了“成功”个体）都会减少。这使得后续抽样成功的概率发生改变，各次抽取不再相互独立。

正是由于这种依赖性，不放回抽样减少了样本中极端结果出现的可能性。例如，如果你连续抽到“成功”个体，总体中的“成功”个体就减少了，这降低了你继续抽到“成功”个体的概率。这种效应限制了变异性，因此超几何分布的方差要小于参数相近的二项分布方差，差异体现在那个小于1的“有限总体修正系数”上。

期望与方差的数学推导

理解公式的来源可以帮助我们更深入地掌握它们。

期望的推导

期望的推导相对直接，可以使用指示随机变量的方法。

定义一个随机变量 X，表示在 n 次抽样中获得的“成功”个体数。
我们将 X 表示为 n 个指示随机变量的总和：X = I₁ + I₂ + … + In，其中 Ii 是一个指示变量，如果第 i 次抽样是“成功”，则 Ii = 1，否则 Ii = 0。
根据期望的线性性质，总和的期望等于期望的总和：E(X) = E(I₁ + I₂ + … + In) = E(I₁) + E(I₂) + … + E(In)。
对于任何一个指示变量 Ii，其期望等于它取值为 1 的概率：E(Ii) = P(第 i 次抽样是“成功”)。
由于是不放回抽样，但考虑到抽样顺序的对称性（任何一个位置抽到特定个体的概率是相同的），第一次抽到“成功”的概率是 K/N，第二次抽到“成功”的概率也是 K/N，以此类推。对于任意的 i，P(第 i 次抽样是“成功”) = K/N。
因此，E(Ii) = K/N 对于所有的 i 都成立。
将它们相加：E(X) = (K/N) + (K/N) + … + (K/N) (共 n 项) = n * (K/N)。

这个推导过程简洁明了，利用了期望的线性性质和抽样过程的对称性。

方差的推导

方差的推导则更为复杂，通常涉及到计算协方差，因为各次抽取不是独立的。简而言之，方差的推导会用到以下事实：

Var(X) = Var(∑ Ii) = ∑ Var(Ii) + 2 * ∑i Cov(Ii, Ij)

其中：

Var(Ii) = P(Ii=1) * P(Ii=0) = (K/N) * ((N-K)/N)。
Cov(Ii, Ij) 是指示变量 Ii 和 Ij 的协方差，它衡量了第 i 次和第 j 次抽样结果的相关性。在不放回抽样中，这个协方差是一个负值，反映了抽到第一个“成功”会降低抽到第二个“成功”的概率。协方差的计算依赖于联合概率 P(Ii=1, Ij=1) = P(第 i 次和第 j 次都是“成功”)。

经过一系列代数运算（计算协方差并求和），最终可以得到包含有限总体修正系数的方差公式。虽然具体的协方差计算和求和过程比较繁琐，但关键在于认识到方差需要考虑非独立性带来的协方差项，并且这些协方差项是负的，从而“修正”了独立情况下的方差（即二项分布方差），使其变小。

另一种理解方式是，超几何分布的方差等于其对应的二项分布方差（即忽略不放回效应，假设每次成功概率都是K/N时的方差）乘以有限总体修正系数：

Var(X) = [n * (K/N) * (1 – K/N)] * [(N – n) / (N – 1)]

这直接显示了修正系数的作用。当 N 趋向无穷大时，(N-n)/(N-1) 趋近于 1，此时超几何分布近似于二项分布，其方差也近似于二项分布的方差。

计算示例：一步步求解期望与方差

我们通过一个具体的例子来演示如何计算超几何分布的期望和方差。

示例问题

一个批次共有 100 个产品，其中有 10 个不合格品。如果从中随机抽取 20 个产品进行检验（不放回），求样本中不合格品数量的期望和方差。

识别参数

总体总数 N = 100
总体中“成功”（不合格品）数量 K = 10
样本大小 n = 20

随机变量 X 表示抽取的 20 个产品中的不合格品数量。

计算期望 E(X)

使用期望公式：E(X) = n * (K / N)
代入数值：E(X) = 20 * (10 / 100)
计算：E(X) = 20 * 0.1 = 2

结论： 在抽取的 20 个产品中，预期会发现 2 个不合格品。

计算方差 Var(X)

使用方差公式：Var(X) = n * (K / N) * ((N – K) / N) * ((N – n) / (N – 1))
计算比例 K/N：10 / 100 = 0.1
计算比例 (N – K) / N：(100 – 10) / 100 = 90 / 100 = 0.9
计算有限总体修正系数 (N – n) / (N – 1)：(100 – 20) / (100 – 1) = 80 / 99
代入数值：Var(X) = 20 * 0.1 * 0.9 * (80 / 99)
计算前三项的乘积：20 * 0.1 * 0.9 = 2 * 0.9 = 1.8
计算最终方差：Var(X) = 1.8 * (80 / 99)
计算分数近似值：80 / 99 ≈ 0.8081
Var(X) ≈ 1.8 * 0.8081 ≈ 1.4546

结论： 样本中不合格品数量的方差约为 1.4546。

如果我们忽略不放回抽样的影响，按照二项分布计算，方差将是 n * p * (1-p) = 20 * 0.1 * 0.9 = 1.8。可以看到，超几何分布的方差 1.4546 确实小于对应的二项分布方差 1.8，体现了有限总体修正系数的作用。

期望与方差在实际中的应用场景

期望和方差不仅是理论概念，它们在许多实际问题中都有应用：

质量控制与抽样检验：

在产品抽样检验中，从一批有限大小的产品中抽取样本，计算样本中的不合格品数量通常符合超几何分布。期望 E(X) 告诉你平均会抽到多少不合格品，这有助于评估抽样计划的严格程度。方差 Var(X) 则告诉你这个不合格品数量的波动会有多大，方差越大，实际抽样结果偏离期望的可能性越大，这有助于评估抽样风险。例如，可以根据期望和方差来设置抽样方案的接收或拒收界限。
扑克牌或其他不放回的抽牌游戏：

计算在抽取的几张牌中，某种特定牌（如Aces、红桃）的数量的期望和方差。期望告诉你平均能拿到多少张这样的牌，方差告诉你这个数量可能有多大的波动。这对于玩家评估手牌强度和制定策略有帮助。
遗传学：

在小规模的基因抽样研究中，从有限的个体中抽取样本来研究某个特定基因型的分布。期望和方差可以帮助预测样本中具有该基因型的个体数量以及其可能的变化范围。
市场调研（针对小范围特定群体）：

如果对一个规模有限的特定客户群体进行不放回抽样调研，想知道样本中拥有某种特征（如购买过某产品）的人数。期望和方差可以帮助规划样本量，并理解调研结果的代表性和波动性。

在这些应用中，期望提供了对平均结果的预测，而方差提供了对结果不确定性的度量。两者结合，帮助我们更好地理解超几何分布所描述的随机现象。

参数变化对期望和方差的影响

改变超几何分布的参数 N、K、n 会如何影响其期望和方差？

样本大小 n 的影响

期望 E(X)： 与 n 成正比。样本越大，预期抽到的“成功”个体越多。
方差 Var(X)： 随着 n 的增加，Var(X) 通常会增加，因为抽取更多个体引入了更多变数。但同时，有限总体修正系数 (N-n)/(N-1) 会随着 n 的增加而减小（当 n 接近 N 时，系数趋近于 0）。这意味着当样本大小占总体比例很高时，变异性会被限制，因为你对总体情况越来越确定。当 n=N 时，Var(X)=0，因为样本就是总体，结果是确定的（你会抽到所有的 K 个“成功”个体）。

总体中“成功”比例 K/N 的影响

期望 E(X)： 与 K/N 成正比。总体中“成功”个体比例越高，预期抽到的“成功”个体越多。
方差 Var(X)： 类似于二项分布，方差与 K/N 呈现抛物线关系，当 K/N 接近 0 或 1 时方差较小，当 K/N 接近 0.5 时方差最大。这是因为比例极高或极低时，样本结果更容易集中在少数几种可能上（接近 0 或 n），而比例居中时，结果的分布更分散。

总体大小 N 的影响

期望 E(X)： 如果 K/N 的比例保持不变，改变 N 不会影响 E(X) 的值。E(X) 只取决于 n 和 K/N 的比例。
方差 Var(X)： 随着 N 的增加（同时保持 K/N 比例不变），有限总体修正系数 (N-n)/(N-1) 会越来越接近 1。这意味着超几何分布的方差会越来越接近对应的二项分布方差。当 N 远大于 n 时，不放回抽样与有放回抽样的区别变得不显著，超几何分布近似于二项分布，其方差也随之近似。

理解这些参数变化的影响，有助于我们在实际应用中预测不同抽样方案或总体特征可能带来的结果变化。

总结

超几何分布的期望 E(X) = n * (K/N) 提供了样本中“成功”个体数量的平均预测值，其形式简单直观。超几何分布的方差 Var(X) = n * (K/N) * ((N – K) / N) * ((N – n) / (N – 1)) 衡量了样本结果的离散程度，其关键在于包含了一个反映不放回抽样效应的有限总体修正系数 ((N – n) / (N – 1))。这个系数使得超几何分布的方差小于相同参数下的二项分布方差。理解这些公式、它们的推导思路以及它们在实际问题中的应用方式，对于准确分析基于有限总体不放回抽样的各种随机现象至关重要。

超几何分布的期望和方差