超几何分布描述了从有限总体中不放回抽样时成功次数的概率分布,其期望和方差公式体现了有限总体抽样的特性。设总体大小为 ,其中成功元素数量为 ,样本容量为 ,则随机变量 (样本中的成功次数)的期望和方差公式如下:
这个结果与二项分布的期望形式一致,直观理解为:每次抽样的成功概率本质上等于总体中成功元素的比例 ,因此 次抽样的平均成功次数为两者的乘积。推导过程中,通过组合数性质和概率之和为1的特性,可将期望简化为上述形式。
方差公式比二项分布多了一个有限总体校正因子 ,这是因为不放回抽样导致各次试验不独立,样本量 占总体 的比例越大,数据波动越小。校正因子 反映了总体规模对抽样误差的影响,当 时,该因子趋近于1,此时超几何分布近似于二项分布。
参数意义:期望 表示样本中成功次数的平均值,方差 描述其波动程度。
与二项分布的区别:超几何分布适用于有限总体不放回抽样(如质检中的破坏性测试),而二项分布适用于无限总体或放回抽样。
简化计算:当 \(N \gg n\)(总体远大于样本)时,校正因子可近似为1,此时超几何分布可用二项分布 \(B(n, \frac{K}{N})\) 近似计算。
例如,从100件产品(含10件次品)中随机抽取5件,次品数 \(X\) 服从超几何分布 \(H(100, 10, 5)\),其期望为 \(5 \cdot \frac{10}{100} = 0.5\),方差为 \(5 \cdot 0.1 \cdot 0.9 \cdot \frac{95}{99} \approx 0.43\),反映了抽样结果的平均水平和波动情况。
这些公式不仅是理论推导的结果,更在质量控制、市场调研等领域有直接应用,帮助我们从有限数据中推断总体特征。
超的基本解释
超
⒈ 越过,高出:超越。高超。超出。超额。超龄。超等。超载。超重。超支。
⒉ 跳上,跨过:“挟泰山以超北海”。
⒊ 在一定范围以外:超自然。超音速。超导现象。
⒋ 遥远:超遥。超忽。
⒌ 怅惘的样子:“武侯超然不对”。
exceed、go beyond、overtake
形声:从走、召声
jump over, leap over; surpass