泊松二项分布
Poisson binomial参数 |
(试验数)
(各试验的成功概率) |
---|
值域 |
k ∈ { 0, …, n } |
---|
概率质量函数 |
![{\displaystyle \sum \limits _{A\in F_{k}}\prod \limits _{i\in A}p_{i}\prod \limits _{j\in A^{c}}(1-p_{j})}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f9d09d8a7b2bed4ad26ce3af7c67f010ee6c2263) |
---|
累积分布函数 |
![{\displaystyle \sum \limits _{l=0}^{k}\sum \limits _{A\in F_{l}}\prod \limits _{i\in A}p_{i}\prod \limits _{j\in A^{c}}(1-p_{j})}](https://wikimedia.org/api/rest_v1/media/math/render/svg/116de8ccb7abd9d7bf4cf11d673538d811b41126) |
---|
期望 |
![{\displaystyle \sum \limits _{i=1}^{n}p_{i}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/850317c9fc543cf1b6e1945f3f462279ea7cafe2) |
---|
方差 |
![{\displaystyle \sigma ^{2}=\sum \limits _{i=1}^{n}(1-p_{i})p_{i}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/152c6768e65350302095a10583037733f8f68974) |
---|
偏度 |
![{\displaystyle {\frac {1}{\sigma ^{3}}}\sum \limits _{i=1}^{n}(1-2p_{i})(1-p_{i})p_{i}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/41b2eceb725f85cec70d4c170d6e44bd30f68ae7) |
---|
峰度 |
![{\displaystyle {\frac {1}{\sigma ^{4}}}\sum \limits _{i=1}^{n}(1-6(1-p_{i})p_{i})(1-p_{i})p_{i}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/4df08bb938e0af8c3c379d30e4701d3839f76d8f) |
---|
矩生成函数 |
![{\displaystyle \prod \limits _{j=1}^{n}(1-p_{j}+p_{j}e^{t})}](https://wikimedia.org/api/rest_v1/media/math/render/svg/dffbb4f997332691520d6a1d6f55d3ee3795bdaf) |
---|
特征函数 |
![{\displaystyle \prod \limits _{j=1}^{n}(1-p_{j}+p_{j}e^{it})}](https://wikimedia.org/api/rest_v1/media/math/render/svg/77182ad8b758b268bbf41b0ff21598b9c288d7a1) |
---|
概率母函数 |
![{\displaystyle \prod \limits _{j=1}^{n}(1-p_{j}+p_{j}z)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/a5c84225aa7d733786ca2fa43eac63513ed47941) |
---|
在概率论和统计学中,泊松二项分布是一个基于独立伯努利试验之和的离散概率分布。这一概念以西梅翁·德尼·泊松的名字命名。
换句话说,它是成功概率分别为
的n次独立伯努利试验中,成功次数的概率分布。普通二项分布是泊松二项分布在所有成功概率相同(即
)时的特例。
概率质量函数[编辑]
n次试验中有k次成功的概率可以写为以下总和[1]
![{\displaystyle \Pr(K=k)=\sum \limits _{A\in F_{k}}\prod \limits _{i\in A}p_{i}\prod \limits _{j\in A^{c}}(1-p_{j})}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e43bd8849d43ca7f5a945a034aae55f9ab2d1030)
其中
是 {1,2,3,..., n } 的全体k元子集的集合。例如,如果n = 3,那么
。
是
的补集,也就是
。
将包含
个元素,因此上述总和在实务中是很难计算的,除非试验次数n很小(例如,如果n = 30,
包含超过1020个元素)。然而,还有其他更有效的方法可以计算
。
只要成功概率都不等于 1,就可以使用递归公式计算出k次成功的概率:[2][3]
![{\displaystyle \Pr(K=k)={\begin{cases}\prod \limits _{i=1}^{n}(1-p_{i})&k=0\\{\frac {1}{k}}\sum \limits _{i=1}^{k}(-1)^{i-1}\Pr(K=k-i)T(i)&k>0\\\end{cases}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/2065bb9d115ae58f5f011057e32a214d65bbd2cd)
其中
![{\displaystyle T(i)=\sum \limits _{j=1}^{n}\left({\frac {p_{j}}{1-p_{j}}}\right)^{i}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/6b97ddef228acb95cffb1bf462e594cddb6daac5)
递归公式在数值上不稳定,在
约大于20时应避免使用。另一种方法是使用分治算法:假设
是2的幂,并以
表示成功概率为
的泊松二项分布,
表示卷积,则
。
另一种可能性是使用离散傅立叶变换。 [4]
![{\displaystyle \Pr(K=k)={\frac {1}{n+1}}\sum \limits _{l=0}^{n}C^{-lk}\prod \limits _{m=1}^{n}\left(1+(C^{l}-1)p_{m}\right)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/85df0d0c083987fe19c1665bfbd0e4c782a06aa0)
其中
,
。
Chen和Liu在“泊松二项式和条件伯努利分布的统计应用”中描述了其他方法。 [5]
均值和方差[编辑]
由于泊松二项式分布变数是n个独立伯努利分布变数的总和,因此其均值和方差将是n个伯努利分布的均值和方差之和:
![{\displaystyle \mu =\sum \limits _{i=1}^{n}p_{i}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/002674b9c088bc51faf4dd07619642545fd126b1)
![{\displaystyle \sigma ^{2}=\sum \limits _{i=1}^{n}(1-p_{i})p_{i}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/152c6768e65350302095a10583037733f8f68974)
当平均值(
)和次数(n)为定值,且所有成功概率相等时,我们会得到二项式分布,方差此时最大。当平均值固定时,方差的上界为具有相同均值的泊松分布的方差,该上界在n趋于无穷大时可以渐近取得。[来源请求]
泊松二项式分布的熵没有简单的公式,但熵的上限是具有相同数字参数和相同均值的二项式分布的熵。因此,熵也不大于相同均值的泊松分布的熵。
谢普-奥尔金凹性猜想由劳伦斯·谢普和英格拉姆·奥尔金于1981年提出,指出泊松二项式分布的熵是成功概率
的凹函数。这个猜想由 Erwan Hillion 和 Oliver Johnson 于2015年证明。1981年同一篇论文亦提出谢普-奥尔金单调性猜想:若
,则熵对
为单调递增。这个猜想也被 Hillion 和 Johnson 于 2019 年证明。
参考资料[编辑]
- ^ Wang, Y. H. On the number of successes in independent trials (PDF). Statistica Sinica. 1993, 3 (2): 295–312 [2023-07-29]. (原始内容存档 (PDF)于2016-03-03).
- ^
Shah, B. K. On the distribution of the sum of independent integer valued random variables. American Statistician. 1994, 27 (3): 123–124. JSTOR 2683639.
- ^ Chen, X. H.; A. P. Dempster; J. S. Liu. Weighted finite population sampling to maximize entropy (PDF). Biometrika. 1994, 81 (3): 457 [2023-07-29]. doi:10.1093/biomet/81.3.457. (原始内容存档 (PDF)于2022-01-07).
- ^
Fernandez, M.; S. Williams. Closed-Form Expression for the Poisson-Binomial Probability Density Function. IEEE Transactions on Aerospace and Electronic Systems. 2010, 46 (2): 803–817. Bibcode:2010ITAES..46..803F. S2CID 1456258. doi:10.1109/TAES.2010.5461658.
- ^ Chen, S. X.; J. S. Liu. Statistical Applications of the Poisson-Binomial and conditional Bernoulli distributions. Statistica Sinica. 1997, 7: 875–892.