概率论与数理统计知识点(二) 离散型随机变量及其分布


1. 随机变量

  • 设随机试验的样本空间为S={e}. X=X(e) 是定义在样本空间S上的实值单值函数。称X=X(e)为随机变量

2. 离散型随机变量

  • 定义: 全部可能取到的值为有限个或可列无限多个,这种随机变量称为离散型随机变量

    骰子的点数,打靶环数,某城市120急救电话一昼夜收到的呼叫次数,都是离散型随机变量

  • 设离散型随机变量X所有可能取的值为xk(k=1,2,)x_k(k=1,2,\cdots)xk​(k=1,2,⋯) ,X取各个可能值的概率,即事件X=xk{X=x_k}X=xk​ 的概率,为 P{X=xk}=Pk,k=1,2,P\{X=x_k\}=P_k, k=1,2,\cdotsP{X=xk​}=Pk​,k=1,2,⋯

    我们称该式为离散型随机变量的分布律

    • 性质:
      • 1o1^o1o pk0,k=1,2,3,;p_k \geq 0, \quad k=1,2,3,\cdots;pk​≥0,k=1,2,3,⋯;
      • 2o2^o2o k=1pk=1.\sum_{k=1}^{\infty}{p_k=1.}∑k=1∞​pk​=1.

3. 离散型随机变量常见分布

3.1 (0-1)分布

  • 设随机变量可能的取值只有0和1,它的分布律为 P{X=k}=pk(1p)k,k=0,1P\{X=k\} = p^k(1-p)^k, \quad k=0,1P{X=k}=pk(1−p)k,k=0,1 ,记做X服从以p为参数的(0-1)分布或两点分布

    X 0 1
    pkp_kpk​ 1p1-p1−p ppp

    新生儿性别,抛硬币,产品质量是否合格 等可以用(0-1)分布的离散型随机变量来表示

3.2 二项分布

  • 设试验E只有两种可能结果:A及A\overline AA ,则称E为伯努利试验 。 设P(A)=pP(A)=1pP(A) = p ,则P(\overline A) = 1 - pP(A)=p,则P(A)=1−p .

  • 将E 独立重复地进行n次, 则称这一连串独立的重复试验为n重伯努利试验

    例如,抛硬币,A表示正面,这就是伯努利试验,将硬币抛n次,就是n重伯努利试验。 掷骰子,A表示等到1点,A\overline AA 表示得到的是非1点,也叫一次伯努利试验等

  • 以X表示n重伯努利试验中,事件A发生的次数,p表示事件A发生的概率,q=1-p 表示A不发生的概率(即A\overline AA发生的概率) ,则有

    P{X=k}=(kn)pkqnkk=0,1,2,nP\{X=k\} = (_k^n)p^kq^{n-k} \quad k=0,1,2\cdots, nP{X=k}=(kn​)pkqn−kk=0,1,2⋯,n

    • k=0nP{X=k}=k=0n(kn)pkqnk=(p+q)n=1\sum_{k=0}^{n}{P\{X=k\}} = \sum_{k=0}^{n}{(_k^n)p^kq^{n-k}} = (p+q)^n=1∑k=0n​P{X=k}=∑k=0n​(kn​)pkqn−k=(p+q)n=1
    • 二项式 (a+b)n=(0n)an0b0+(1n)an1b1++(n1n)an(n1)bn1+(nn)annbn=k=0n(kn)ankbk(a+b)^n = (_0^n)a^{n-0}b^{0}+(_1^n)a^{n-1}b^{1}+\cdots+(_{n-1}^n)a^{n-(n-1)}b^{n-1}+(_n^n)a^{n-n}b^{n} = \sum_{k=0}^{n}{(_k^n)a^{n-k}b^{k}}(a+b)n=(0n​)an−0b0+(1n​)an−1b1+⋯+(n−1n​)an−(n−1)bn−1+(nn​)an−nbn=∑k=0n​(kn​)an−kbk

    我们发现 (kn)pkqnk(_{k}^{n})p^kq^{n-k}(kn​)pkqn−k 刚好是 (p+q)n(p+q)^n(p+q)n 展开式中出现pkp^kpk的那一项,因此,我们称随机变量X服从以n,p为参数的二项分布,记做 Xb(n,p)X\sim b(n,p)X∼b(n,p)

3.3 泊松分布

  • 设随机变量X的可能取值为0,1,2,0,1,2,\cdots0,1,2,⋯ 而各个取值的概率为 P{X=k}=λkk!eλk=0,1,2,P\{X=k\}= \frac{\lambda^k}{k!}e^{-\lambda} \quad k=0,1,2,\cdotsP{X=k}=k!λk​e−λk=0,1,2,⋯ 其中λ>0\lambda > 0λ>0 为常数,则称X服从以λ\lambdaλ为参数的泊松分布,记做 Xπ(λ)X \sim \pi(\lambda)X∼π(λ)

    • k=0P{X=k}=k=0λkk!eλ=eλk=0λkk!=eλeλ=1\sum_{k=0}^{\infty}P\{X=k\}= \sum_{k=0}^{\infty}\frac{\lambda^k}{k!}e^{-\lambda}=e^{-\lambda}\sum_{k=0}^{\infty}\frac{\lambda^k}{k!} = e^{-\lambda} \cdot e^\lambda = 1∑k=0∞​P{X=k}=∑k=0∞​k!λk​e−λ=e−λ∑k=0∞​k!λk​=e−λ⋅eλ=1

    • 其中 k=0λkk!=eλ\sum_{k=0}^{\infty}\frac{\lambda^k}{k!} = e^\lambda∑k=0∞​k!λk​=eλ 证明如下,需要用到泰勒公式

    泰勒公式

    如果函数f(x)f(x)f(x)在x0x_0x0​的某个邻域U(x0)U(x_0)U(x0​)内具有(n+1)阶导数,那么对任一xU(x0)x \in U(x_0)x∈U(x0​) 有 f(x)=f(x0)+f(x0)(xx0)+f(x0)2!(xx0)2++f(n)(x0)n!(xx0)n+Rn(x)f(x)=f(x_0)+f^{'}(x_0)(x-x_0)+\frac{f^{''}(x_0)}{2!}(x-x_0)^2+\cdots+\frac{f^{(n)}(x_0)}{n!}(x-x_0)^n+R_{n}(x)f(x)=f(x0​)+f′(x0​)(x−x0​)+2!f′′(x0​)​(x−x0​)2+⋯+n!f(n)(x0​)​(x−x0​)n+Rn​(x)

    f(x)=n=0Nf(n)(x0)n!(xx0)n+Rn(x)f(x)=\sum_{n=0}^{N}\frac{f^{(n)}(x_0)}{n!}(x-x_0)^n+R_{n}(x)f(x)=∑n=0N​n!f(n)(x0​)​(x−x0​)n+Rn​(x) 当 x0=0x_0=0x0​=0 时,有 f(x)=n=0Nf(n)(0)n!xn+Rn(x)f(x)=\sum_{n=0}^{N}\frac{f^{(n)}(0)}{n!}x^n+R_{n}(x)f(x)=∑n=0N​n!f(n)(0)​xn+Rn​(x)

    此时有 ex=n=0N(ex)(n)(0)n!xn+Rn(x)(ex)(n)=ex(ex)(n)(0)=1ex=n=0N1n!xn+Rn(x)Rn(x)xnexn=0N1n!xne^x=\sum_{n=0}^{N}\frac{(e^x)^{(n)}(0)}{n!}x^n+R_{n}(x) \\ \because (e^x)^{(n)}=e^x \therefore (e^x)^{(n)}(0) = 1 \\ \therefore e^x= \sum_{n=0}^{N}\frac{1}{n!}x^n+R_{n}(x),R_{n}(x) 为关于x^n的高阶无穷小,则 e^x \approx \sum_{n=0}^{N}\frac{1}{n!}x^nex=∑n=0N​n!(ex)(n)(0)​xn+Rn​(x)∵(ex)(n)=ex∴(ex)(n)(0)=1∴ex=∑n=0N​n!1​xn+Rn​(x),Rn​(x)为关于xn的高阶无穷小,则ex≈∑n=0N​n!1​xn

    • eλ=k=0λkk!\therefore 有 e^\lambda = \sum_{k=0}^{\infty}\frac{\lambda^k}{k!} 成立∴有eλ=∑k=0∞​k!λk​成立

    一本书一页中的印刷错误数,某医院在一天内的急诊病人数,某一个地区一个时间间隔内发生交通事故的次数等均服从泊松分布

  • 泊松定理λ>0\lambda >0λ>0是一个常数,n是任意正整数,设npn=λnp_n=\lambdanpn​=λ ,则对于任一固定的非负整数k,有limn(kn)pnk(1pn)nk=λkeλk!\lim_{n\rightarrow\infty}(_k^n)p_n^k(1-p_n)^{n-k}=\frac{\lambda^ke^{-\lambda}}{k!}n→∞lim​(kn​)pnk​(1−pn​)n−k=k!λke−λ​

证明如下 :

λ=npnpn=λnlimn(kn)pnk(1pn)nk=limnn!k!(nk)!λknk(1λn)nk=limnλkk!(nk+1)!nk(1λn)n(1λn)k=limnλkk![1(11n)(12n)(1k1n)](1λn)n(1λn)klimn[1(11n)(12n)(1k1n)]=1limn(1λn)n=eλlimn(1λn)k=1limn(kn)pnk(1pn)nk=λkeλk!\begin{aligned}\because \lambda = np_n \quad \therefore p_n &= \frac{\lambda}{n} \\ \lim_{n\rightarrow\infty}(_k^n)p_n^k(1-p_n)^{n-k} &= \lim_{n\rightarrow\infty} \frac{n!}{k!(n-k)!}\frac{\lambda^k}{n^k}(1-\frac{\lambda}{n})^{n-k} \\&= \lim_{n\rightarrow\infty}\frac{\lambda^k}{k!}\frac{(n-k+1)!}{n^k}(1-\frac{\lambda}{n})^{n}(1-\frac{\lambda}{n})^{-k} \\&=\lim_{n\rightarrow\infty}\frac{\lambda^k}{k!}[1\cdot(1-\frac{1}{n})(1-\frac{2}{n})\cdots(1-\frac{k-1}{n})](1-\frac{\lambda}{n})^{n}(1-\frac{\lambda}{n})^{-k} \\ \because &\lim_{n\rightarrow\infty}[1\cdot(1-\frac{1}{n})(1-\frac{2}{n})\cdots(1-\frac{k-1}{n})] = 1 \\ &\lim_{n\rightarrow\infty}(1-\frac{\lambda}{n})^{n} = e^{-\lambda}\\ &\lim_{n\rightarrow\infty}(1-\frac{\lambda}{n})^{-k} = 1\\ \therefore \lim_{n\rightarrow\infty}(_k^n)p_n^k(1-p_n)^{n-k} &= \frac{\lambda^ke^{-\lambda}}{k!}\end{aligned}∵λ=npn​∴pn​n→∞lim​(kn​)pnk​(1−pn​)n−k∵∴n→∞lim​(kn​)pnk​(1−pn​)n−k​=nλ​=n→∞lim​k!(n−k)!n!​nkλk​(1−nλ​)n−k=n→∞lim​k!λk​nk(n−k+1)!​(1−nλ​)n(1−nλ​)−k=n→∞lim​k!λk​[1⋅(1−n1​)(1−n2​)⋯(1−nk−1​)](1−nλ​)n(1−nλ​)−kn→∞lim​[1⋅(1−n1​)(1−n2​)⋯(1−nk−1​)]=1n→∞lim​(1−nλ​)n=e−λn→∞lim​(1−nλ​)−k=1=k!λke−λ​​

  • 该定理说明,当n很大,p很小时,二项分布可用泊松分布近似 即 (kn)pk(1p)nkλkeλk!(λ=np)(_k^n)p^k(1-p)^{n-k} \approx \frac{\lambda^ke^{-\lambda}}{k!} \quad (\lambda=np)(kn​)pk(1−p)n−k≈k!λke−λ​(λ=np)

    一般地,当 n100,np10n \geq 100,np \leq 10n≥100,np≤10 时,即可用泊松分布来近似计算二项分布

3.4 几何分布

  • 在伯努利试验中,记每次试验中事件A发生的概率为p,试验进行到事件A出现时停止,此时所进行的试验次数为X,其分布率为 P{X=k}=(1p)k1pk=1,2,3,P\{X=k\}=(1-p)^{k-1}p \quad k = 1,2,3,\cdotsP{X=k}=(1−p)k−1pk=1,2,3,⋯ , 则称X服从p为参数的几何分布,记作 XG(p)X \sim G(p)X∼G(p)

    k=1P{X=k}=k=1(1p)k1p=pk=1(1p)k1=p1(1p)k1(1p)1(1p)=1(1p)k0p1k+k=1P{X=k}=1\begin{aligned}\sum_{k=1}^{\infty}P\{X=k\} &= \sum_{k=1}^{\infty}(1-p)^{k-1}p \\&= p\sum_{k=1}^{\infty}(1-p)^{k-1} \\ &= p \frac{1-(1-p)^{k-1}(1-p)}{1-(1-p)} \\ &= 1-(1-p)^k \\ &\because 0\leq p \leq1 \quad k \rightarrow +\infty \\ \therefore \sum_{k=1}^{\infty}P\{X=k\}&=1 \end{aligned}k=1∑∞​P{X=k}∴k=1∑∞​P{X=k}​=k=1∑∞​(1−p)k−1p=pk=1∑∞​(1−p)k−1=p1−(1−p)1−(1−p)k−1(1−p)​=1−(1−p)k∵0≤p≤1k→+∞=1​

  • 几何分布用来描述n次伯努利试验中,事件A 首次发生的概率

3.5 超几何分布

  • 在产品质量的不放回抽检中,若N件产品中有M件次品,抽检n件时所得次品数X=k,此时有P{X=k}=(kM)(nkNM)(nN)k=0,1,,min{n,M}.P\{X=k\}=\frac{(_k^M)(_{n-k}^{N-M})}{(_n^N)} \quad k= 0,1,\cdots,min\{n,M\}.P{X=k}=(nN​)(kM​)(n−kN−M​)​k=0,1,⋯,min{n,M}.

    称X服从以n,N,M 为参数的超几何分布,记做XH(n,M,N)X\sim H(n,M,N)X∼H(n,M,N)

  • N+N\rightarrow +\inftyN→+∞时,超几何分布可用二项分布近似计算,此时有 MNP\frac{M}{N}\rightarrow PNM​→P

    证明如下:

    首先我们要明确要证明的等式是 当N+N\rightarrow +\inftyN→+∞时 P{X=k}=(kM)(nkNM)(nN)=(kn)pkqnkP\{X=k\}=\frac{(_k^M)(_{n-k}^{N-M})}{(_n^N)} = (_k^n)p^kq^{n-k}P{X=k}=(nN​)(kM​)(n−kN−M​)​=(kn​)pkqn−k ,即 limn+(kM)(nkNM)(nN)=(kn)pkqnk\lim_{n\rightarrow+\infty}\frac{(_k^M)(_{n-k}^{N-M})}{(_n^N)} = (_k^n)p^kq^{n-k}limn→+∞​(nN​)(kM​)(n−kN−M​)​=(kn​)pkqn−k.

    limn+(kM)(nkNM)(nN)=limn+M!k!(Mk)!(NM)!(nk)!(NMn+k)!n!(Nn)!N!=limn+n!k!(nk)!M(M1)(Mk+1)Nk(NM)!(nk)!(NMn+k)!NkN(N1)(Nn+1)(Nk)n!k!(nk)!=(kn),limn+M(M1)(Mk+1)Nk=limn+MN(MN1N)(MNkN+1N)=(MN)k,NkN(N1)(Nn+1)=NkN(N1)(Nk+1)(Nk)(Nk1)(Nn+1)=11(11N)(12N)(1kN+1N)(Nk)(Nk1)(Nn+1)limn+NkN(N1)(Nn+1)=limn+1(Nk)(Nk1)(Nn+1),limn+(kM)(nkNM)(nN)=limn+(kn)(MN)k(NM)(NM1)(NMn+k+1)NnkNnk(Nk)(Nk1)(Nn+1)(Nnk)=limn+(kn)(MN)k[(1MN)(1MN1N)(1MNnk1N)][1(1kN)(1k+1N)(1n1N)]=(kn)(MN)k(1MN)nk\begin{aligned} \lim_{n\rightarrow+\infty}\frac{(_k^M)(_{n-k}^{N-M})}{(_n^N)} &= \lim_{n\rightarrow+\infty}\frac{M!}{k!(M-k)!}\frac{(N-M)!}{(n-k)!(N-M-n+k)!}\frac{n!(N-n)!}{N!} \\ &= \lim_{n\rightarrow+\infty} \frac{n!}{k!(n-k)!}\frac{M(M-1)\cdots(M-k+1)}{N^k}\frac{(N-M)!}{(n-k)!(N-M-n+k)!} \frac{N^k}{N(N-1)\cdots(N-n+1)} \quad (N^k 为构造出来的中间量) \\ &\frac{n!}{k!(n-k)!} = (_k^n) ,\\ & \lim_{n\rightarrow+\infty}\frac{M(M-1)\cdots(M-k+1)}{N^k} = \lim_{n\rightarrow+\infty}\frac{M}{N}(\frac{M}{N}-\frac{1}{N})\cdots(\frac{M}{N}-\frac{k}{N}+\frac{1}{N})=(\frac{M}{N})^k,\\ &\frac{N^k}{N(N-1)\cdots(N-n+1)}= \frac{N^k}{N(N-1)\cdots(N-k+1)(N-k)(N-k-1)\cdots(N-n+1)} = \frac{1}{1\cdot(1-\frac{1}{N})(1-\frac{2}{N})\cdots(1-\frac{k}{N}+\frac{1}{N})(N-k)(N-k-1)\cdots(N-n+1)} \\ &\therefore \lim_{n\rightarrow+\infty}\frac{N^k}{N(N-1)\cdots(N-n+1)}= \lim_{n\rightarrow+\infty}\frac{1}{(N-k)(N-k-1)\cdots(N-n+1)},\\ \therefore \lim_{n\rightarrow+\infty}\frac{(_k^M)(_{n-k}^{N-M})}{(_n^N)} &=\lim_{n\rightarrow+\infty}(_k^n)(\frac{M}{N})^k\frac{(N-M)(N-M-1)\cdots(N-M-n+k+1)}{N^{n-k}}\frac{N^{n-k}}{(N-k)(N-k-1)\cdots(N-n+1)} \quad (N^{n-k}为构造出来的中间量) \\ &=\lim_{n\rightarrow+\infty}(_k^n)(\frac{M}{N})^k[(1-\frac{M}{N})(1-\frac{M}{N}-\frac{1}{N})\cdots(1-\frac{M}{N}-\frac{n-k-1}{N})][\frac{1}{(1-\frac{k}{N})(1-\frac{k+1}{N})\cdots(1-\frac{n-1}{N})}] \\ &= (_k^n)(\frac{M}{N})^k(1-\frac{M}{N})^{n-k} \\ \therefore 命题得证 \end{aligned} n→+∞lim​(nN​)(kM​)(n−kN−M​)​∴n→+∞lim​(nN​)(kM​)(n−kN−M​)​∴命题得证​=n→+∞lim​k!(M−k)!M!​(n−k)!(N−M−n+k)!(N−M)!​N!n!(N−n)!​=n→+∞lim​k!(n−k)!n!​NkM(M−1)⋯(M−k+1)​(n−k)!(N−M−n+k)!(N−M)!​N(N−1)⋯(N−n+1)Nk​(Nk为构造出来的中间量)k!(n−k)!n!​=(kn​),n→+∞lim​NkM(M−1)⋯(M−k+1)​=n→+∞lim​NM​(NM​−N1​)⋯(NM​−Nk​+N1​)=(NM​)k,N(N−1)⋯(N−n+1)Nk​=N(N−1)⋯(N−k+1)(N−k)(N−k−1)⋯(N−n+1)Nk​=1⋅(1−N1​)(1−N2​)⋯(1−Nk​+N1​)(N−k)(N−k−1)⋯(N−n+1)1​∴n→+∞lim​N(N−1)⋯(N−n+1)Nk​=n→+∞lim​(N−k)(N−k−1)⋯(N−n+1)1​,=n→+∞lim​(kn​)(NM​)kNn−k(N−M)(N−M−1)⋯(N−M−n+k+1)​(N−k)(N−k−1)⋯(N−n+1)Nn−k​(Nn−k为构造出来的中间量)=n→+∞lim​(kn​)(NM​)k[(1−NM​)(1−NM​−N1​)⋯(1−NM​−Nn−k−1​)][(1−Nk​)(1−Nk+1​)⋯(1−Nn−1​)1​]=(kn​)(NM​)k(1−NM​)n−k​

    • 需要注意的是,前面我们说到,计算二项分布时,可用泊松分布近似,因此在利用二项分布近似计算超几何分布时,可根据情况,对二项分布使用泊松进行分布进行近似计算
上一篇:PTA 乙级 1037 在霍格沃茨找零钱 (20分)


下一篇:is there a way to find the list of slab aliases for a given kmem_cache