第四次习题课

李函哲

目录
阅读地图
  • 本章集中在连续分布、多元正态、变换公式、GOE 和若干积分估计。
  • 多元题目的核心是“密度、线性变换、协方差矩阵、正交不变性”。
  • Jensen、尾积分公式和正态尾界是后续大数定律与集中不等式的工具箱。

提示 正态分布题中,协方差为零是否推出独立,只有在线性高斯结构中才可以直接使用。

习题3.1

旁注

连续密度和卷积题要分开处理归一化、换元、Jacobian 与独立性;每个积分先确认支撑集。

题目

求以下分布的归一化常数:

  1. f(x)=1C1x(1x)f(x)=\frac{1}{C}\frac{1}{\sqrt{x(1-x)}}, 0<x<10<x<1
  2. f(x)=1Cexexf(x)=\frac{1}{C}e^{-x-e^{-x}}, xRx\in\mathbb{R}
证明
f(x)=1C1x(1x),0<x<1f(x)=\frac{1}{C}\frac{1}{\sqrt{x(1-x)}},\quad 0<x<1

01f(x)dx=1\int_{0}^{1}f(x)\,dx=1,得

1C01dxx(1x)=1\frac{1}{C}\int_{0}^{1}\frac{dx}{\sqrt{x(1-x)}}=1

计算积分:令 x=sin2tx=\sin^2 t,则 dx=2sintcostdtdx=2\sin t\cos t\,dt

x(1x)=sintcost,01dxx(1x)=0π/22dt=π\sqrt{x(1-x)}=\sin t\cos t,\quad \int_{0}^{1}\frac{dx}{\sqrt{x(1-x)}}=\int_{0}^{\pi/2}2\,dt=\pi

所以

πC=1C=π.\frac{\pi}{C}=1 \quad\Rightarrow\quad C=\pi.
  1. 注意到 exexdx=eex+C\int e^{-x-e^{-x}}\,dx=e^{-e^{-x}}+C,计算立得 C=1C=1
题目

求下面积分的归一化常数

R2x1x2e12(x12+x22)dx1dx2\int_{\mathbb{R}^2} |x_1 - x_2| e^{-\frac{1}{2}(x_1^2 + x_2^2)} \, dx_1 dx_2
证明

u=x1x2, v=x1+x2u = x_1 - x_2,\ v = x_1 + x_2

J=12|J| = \frac{1}{2} 上式=R2ue14(u2+v2)12dudv\text{上式}= \int_{\mathbb{R}^2} |u| e^{-\frac{1}{4}(u^2 + v^2)} \cdot \frac{1}{2} \, du dv =20+ue14u2du0+e14v2dv= 2 \int_{0}^{+\infty} u e^{-\frac{1}{4}u^2} \, du \cdot \int_{0}^{+\infty} e^{-\frac{1}{4}v^2} \, dv =4π.= 4\sqrt{\pi}.

从而 C=4πC=4\sqrt{\pi}

题目

随机变量 X,YX,Y 相互独立且服从参数为 11 的指数分布,求 U=X+YU=X+Y 的密度。

证明

直接计算 fU(u)=0uexexudx=ueu1u0f_U(u)=\int_0^u e^{-x}e^{x-u}\,dx=u e^{-u}\mathbb{1}_{u\geq 0}

题目
  1. X,Y,ZX,Y,Z 相互独立,且均服从 [0,1][0,1] 上的均匀分布。 (1) 求 logX-\log X 的密度函数; (2) 证明 W=(XY)ZW=(XY)^Z 也服从 [0,1][0,1] 上的均匀分布。
证明

(1) P(logXx)=P(Xex)=1ex\mathbb{P}(-\log X \leq x)=\mathbb{P}(X\geq e^{-x})=1-e^{-x},故密度为 ex1x0e^{-x}\mathbb{1}_{x\geq 0}

(2) 由 W=(XY)ZW=(XY)^ZlogW=Z(logXlogY)-\log W=Z(-\log X-\log Y),故只需证明 Z(logXlogY)Z(-\log X-\log Y) 服从参数为 11 的指数分布。记 T=logXlogYT=-\log X-\log Y,由上题,

fT(t)=tet1t0.f_T(t) = te^{-t} \mathbb{1}_{t \geq 0}. fT,Z(t,z)=tet1t010z1.f_{T,Z}(t, z) = te^{-t} \mathbb{1}_{t \geq 0} \mathbb{1}_{0 \leq z \leq 1}.

只需证明 R=TZR=TZ 服从参数为 11 的指数分布。

作变换 r=tzr=tz, s=ts=t

J=(zrzstrts)=(1srs201).J = \begin{pmatrix} \frac{\partial z}{\partial r} & \frac{\partial z}{\partial s} \\ \frac{\partial t}{\partial r} & \frac{\partial t}{\partial s} \end{pmatrix} = \begin{pmatrix} \frac{1}{s} & -\frac{r}{s^2} \\ 0 & 1 \end{pmatrix}. det(J)=1s,|\det(J)| = \frac{1}{s},

由联合密度函数变换公式,得

fR,S(r,s)=es10rs.f_{R,S}(r,s)=e^{-s}\mathbb{1}_{0\leq r\leq s}. fR(r)=Res10rsds=1r0r+esds=er1r0.f_R(r)=\int_{\mathbb{R}}e^{-s}\mathbb{1}_{0\leq r\leq s}\,ds =\mathbb{1}_{r\geq 0}\int_r^{+\infty}e^{-s}\,ds =e^{-r}\mathbb{1}_{r\geq 0}.

习题3.2

旁注

矩计算常走三条路:直接积分、递推或分部积分、母函数。正态和半圆律的矩值得对照。

题目

XX 服从标准正态分布,YY 服从标准 Wigner 半圆律,求它们的各阶矩。

证明

因为二者都是对称随机变量,只需计算 2k2k 阶矩。

E[X2k]=+x2k12πe12x2dx=2k+122π0+uk12eudu(令 u=x22)=2k+122πΓ ⁣(k+12)=2k+122π(π(2k1)!!2k)(利用 Γ(n+1)=nΓ(n) 与 Γ(12)=π)=(2k1)!!\begin{aligned} \mathbb{E}[X^{2k}] &= \int_{-\infty}^{+\infty} x^{2k} \frac{1}{\sqrt{2\pi}} e^{-\frac{1}{2}x^2} \, dx \\ &= \frac{2^{k+\frac{1}{2}}}{\sqrt{2\pi}} \int_{0}^{+\infty} u^{k-\frac{1}{2}} e^{-u} \, du \quad (\text{令 } u = \frac{x^2}{2}) \\ &= \frac{2^{k+\frac{1}{2}}}{\sqrt{2\pi}} \, \Gamma\!\left(k + \frac{1}{2}\right) \\ &= \frac{2^{k+\frac{1}{2}}}{\sqrt{2\pi}} \cdot \left( \frac{\sqrt{\pi} \, (2k-1)!!}{2^k} \right) \quad (\text{利用 } \Gamma(n+1)=n\Gamma(n) \text{ 与 } \Gamma(\tfrac12)=\sqrt{\pi}) \\ &= (2k-1)!! \end{aligned}

对于半圆律:

E[Y2k]=20212πy2k4y2dy=令 y=2sinθ22k+2π0π2(sinθ)2kcos2θdθ=22k+2π0π2[(sinθ)2k(sinθ)2k+2]dθ.\begin{aligned} \mathbb{E}[Y^{2k}] &= 2 \int_{0}^{2} \frac{1}{2\pi} y^{2k} \sqrt{4 - y^2} \, dy \\ &\overset{\text{令 } y = 2\sin\theta}{=} \frac{2^{2k+2}}{\pi} \int_{0}^{\frac{\pi}{2}} (\sin\theta)^{2k} \cos^2\theta \, d\theta \\ &= \frac{2^{2k+2}}{\pi} \int_{0}^{\frac{\pi}{2}} \left[ (\sin\theta)^{2k} - (\sin\theta)^{2k+2} \right] \, d\theta. \end{aligned}

数学分析里已经算过:

0π2sinnxdx={n1nn3n212π2,n 为正偶数n1nn2n3131,n 为正奇数\begin{aligned} \int_{0}^{\frac{\pi}{2}} \sin^n x \, dx = \begin{cases} \dfrac{n-1}{n} \dfrac{n-3}{n-2} \cdots \dfrac{1}{2} \cdot \dfrac{\pi}{2}, & n \text{ 为正偶数} \\ \dfrac{n-1}{n} \dfrac{n-2}{n-3} \cdots \dfrac{1}{3} \cdot 1, & n \text{ 为正奇数} \end{cases} \end{aligned}

代入得到最后的结果为 1k+1(2kk)\dfrac{1}{k+1}\dbinom{2k}{k}

题目

(X,Y)(X, Y) 联合密度为

f(x,y)=C1x(yx)ey,0xy<.f(x, y) = C^{-1} x (y - x) e^{-y}, \quad 0 \leq x \leq y < \infty.

求常数 CC,条件密度 fXYf_{X|Y} 与条件期望 E[YX]\mathbb{E}[Y|X]

证明
0+0yCx(yx)eydxdy=0+Ceydy0yx(yx)dx=0+C16y3eydy=C163!=C.\begin{aligned} &\int_{0}^{+\infty} \int_{0}^{y} Cx (y - x)e^{-y} \, dx \, dy \\ &= \int_{0}^{+\infty} Ce^{-y} \, dy \int_{0}^{y} x(y - x) \, dx \\ &= \int_{0}^{+\infty} C \cdot \frac{1}{6} y^3 e^{-y} \, dy \\ &= C \cdot \frac{1}{6} \cdot 3! \\ &= C. \end{aligned}

C=1C = 1.

fXY(x)=f(x,y)fY(y)=x(yx)ey10xy16y3ey=6x(yx)y310xy.\begin{aligned} f_{X|Y}(x) &= \frac{f(x, y)}{f_Y(y)} \\ &= \frac{x(y - x)e^{-y} \mathbb{1}_{0 \leq x \leq y}}{\frac{1}{6}y^3 e^{-y}} \\ &= \frac{6x(y - x)}{y^3} \mathbb{1}_{0 \leq x \leq y}. \end{aligned}

类似地,

fYX(y)=f(x,y)fX(x)=x(yx)ey10xyxex=(yx)e(yx)1yx.\begin{aligned} f_{Y|X}(y) &= \frac{f(x, y)}{f_X(x)} \\ &= \frac{x(y - x)e^{-y} \mathbb{1}_{0 \leq x \leq y}}{x e^{-x}} \\ &= (y - x)e^{-(y-x)} \mathbb{1}_{y \geq x}. \end{aligned} E[YX]=xy(yx)e(yx)dy=X+2.\begin{aligned} \mathbb{E}[Y \mid X] &= \int_{x}^{\infty} y (y - x) e^{-(y-x)} \, dy \\ &= X + 2. \end{aligned}
题目

4. 设 ggR\mathbb{R} 上连续可微函数,并且 gg 和其导数 gg' 均有界,证明

XN(μ,σ2)    E[(Xμ)g(X)]=σ2E[g(X)].X \sim N(\mu, \sigma^2) \implies \mathbb{E}[(X - \mu)g(X)] = \sigma^2 \mathbb{E}[g'(X)].
证明

不妨令 ZN(0,1)Z\sim N(0,1)

Ef(Z)=12πRet2/2f(t)dt=12π0f(t)twew2/2dwdt12π0f(t)twew2/2dwdt=Fubini12π0wew2/2[0wf(t)dt]dw12π0wew2/2[w0f(t)dt]dw=12π0wew2/2f(w)dw+12π0wew2/2f(w)dw=E[Zf(Z)].\begin{aligned} & \mathbb{E} f^{\prime}(Z)=\frac{1}{\sqrt{2 \pi}} \int_{\mathbb{R}} e^{-t^2 / 2} f^{\prime}(t) d t \\ & \quad=\frac{1}{\sqrt{2 \pi}} \int_0^{\infty} f^{\prime}(t) \int_t^{\infty} w e^{-w^2 / 2} d w d t-\frac{1}{\sqrt{2 \pi}} \int_{-\infty}^0 f^{\prime}(t) \int_{-\infty}^t w e^{-w^2 / 2} d w d t \\ & \quad \overset{Fubini}{=} \frac{1}{\sqrt{2 \pi}} \int_0^{\infty} w e^{-w^2 / 2}\left[\int_0^w f^{\prime}(t) d t\right] d w-\frac{1}{\sqrt{2 \pi}} \int_{-\infty}^0 w e^{-w^2 / 2}\left[\int_w^0 f^{\prime}(t) d t\right] d w \\ & \quad = \frac{1}{\sqrt{2 \pi}} \int_0^{\infty} w e^{-w^2 / 2}f(w) d w+\frac{1}{\sqrt{2 \pi}} \int_{-\infty}^0 w e^{-w^2 / 2}f(w) d w \\ & \quad=\mathbb{E}[Z f(Z)] . \end{aligned}

反之,如果 ZZ 满足方程 E(Zg(Z))=E(g(Z))\mathbb{E}(Zg(Z))=\mathbb{E}(g^{\prime}(Z)),考虑 Stein 方程

xf(x)f(x)=h(x)E(h(G))xf(x)-f^{\prime}(x)=h(x)-\mathbb{E}(h(G))

(其中 GN(0,1)G \sim N(0,1))。固定 hh,这是一个关于 ff 的常微分方程,具有唯一解。令 h(x)=1xzh(x)=\mathbb{1}_{x\leq z}。把 x=Zx=Z 代入,两边求期望得到:

0=E(Zf(Z))E(f(Z))=P(Zz)P(Gz)0=\mathbb{E}(Zf(Z))-\mathbb{E}(f^{\prime}(Z))=\mathbb{P}(Z\leq z)-\mathbb{P}(G\leq z)

这就说明了 Z=lawGZ\overset{\mathrm{law}}{=}G

题目

{Xr:1rn}\{X_r : 1 \leq r \leq n\} 是独立同分布且方差有限的随机变量列,记

X=1nk=1nXk.\overline{X} = \frac{1}{n} \sum_{k=1}^n X_k.

求协方差 Cov(X,XkX)\operatorname{Cov}(\overline{X}, X_k - \overline{X})

证明
Cov(Xˉ,XkXˉ)=Cov(Xˉ,Xk)Cov(Xˉ,Xˉ)=Cov(Xkn,Xk)Var(Xˉ)=Var(Xk)n1n2Var ⁣(k=1nXk)=Var(Xk)n1nVar(Xk)=0.\begin{aligned} &\operatorname{Cov}\left(\bar{X}, X_k-\bar{X}\right)\\ =&\operatorname{Cov}\left(\bar{X}, X_k\right) -\operatorname{Cov}\left(\bar{X}, \bar{X}\right)\\ =&\operatorname{Cov}\left(\frac{X_k}{n}, X_k\right) -\operatorname{Var}(\bar{X})\\ =&\frac{\operatorname{Var}(X_k)}{n}-\frac{1}{n^2}\operatorname{Var}\!\left(\sum_{k=1}^n X_k\right)\\ =&\frac{\operatorname{Var}(X_k)}{n}-\frac{1}{n}\operatorname{Var}(X_k)\\ =&0. \end{aligned}
题目

XX 为非负随机变量,证明对任意 r>0r > 0 都有

E[Xr]=0rtr1P(Xt)dt.\mathbb{E}[X^r] = \int_0^\infty r t^{r-1}\mathbb{P}(X \geq t)\,dt.
证明
E[Xr]=E ⁣[0Xrtr1dt]=E ⁣[0+rtr11tXdt]=0rtr1E[1tX]dt(Fubini)=0rtr1P(Xt)dt.\begin{aligned} \mathbb{E}[X^r] &= \mathbb{E}\!\left[\int_0^X r t^{r-1}\,dt\right] \\ &= \mathbb{E}\!\left[\int_0^{+\infty} r t^{r-1}\mathbb{1}_{t \leq X}\,dt\right] \\ &= \int_0^{\infty} r t^{r-1}\mathbb{E}[\mathbb{1}_{t \leq X}]\,dt \qquad \text{(Fubini)} \\ &= \int_0^{\infty} r t^{r-1}\mathbb{P}(X \geq t)\,dt. \end{aligned}
题目

对独立同分布随机变量 XXYY,证明 (1) U=X+YU=X+YV=XYV=X-Y 不相关但未必独立。 (2) 若 X,YN(0,1)X,Y\sim N(0,1),则 UUVV 独立。

证明

(1)

E[(X+Y)(XY)]=EX2EY2=0.\mathbb{E}[(X+Y)(X-Y)]=\mathbb{E} X^2-\mathbb{E} Y^2=0. E[X+Y]E[XY]=E[X]2E[Y]2=0.\mathbb{E}[X+Y]\mathbb{E}[X-Y]=\mathbb{E}[X]^2-\mathbb{E}[Y]^2=0.

故不相关。 当 X,YX,Y 独立同分布于 B(1,12)B(1,\frac{1}{2}) 时,X+YX+YXYX-Y 不独立。 (2)

fX,Y(x,y)=12πe12x212y2 令 u=x+yv=xyJ=(xuxvyuyv)=(12121212)detJ=12fU,V(u,v)=14πe14u214v2=12π2e12(u2)212π2e12(v2)2.\begin{aligned} & f_{X , Y}(x , y)=\frac{1}{2 \pi} e^{-\frac{1}{2} x^2-\frac{1}{2} y^2} \\ & \text { 令 } u=x+y \quad v=x-y \\ & J=\left(\begin{array}{cc} \frac{\partial x}{\partial u} & \frac{\partial x}{\partial v} \\[5pt] \frac{\partial y}{\partial u} & \frac{\partial y}{\partial v} \end{array}\right)=\left(\begin{array}{cc} \frac{1}{2} & \frac{1}{2} \\[5pt] \frac{1}{2} & -\frac{1}{2} \end{array}\right) \\ & |\operatorname{det} J|=\frac{1}{2} \\ & \begin{aligned} f_{U ,V}(u , v) & =\frac{1}{4 \pi} e^{-\frac{1}{4} u^2-\frac{1}{4} v^2} \\ & =\frac{1}{\sqrt{2 \pi} \cdot \sqrt{2}} e^{-\frac{1}{2}\left(\frac{u}{\sqrt{2}}\right)^2}\cdot \frac{1}{\sqrt{2 \pi} \cdot \sqrt{2}} e^{-\frac{1}{2}\left(\frac{v}{\sqrt{2}}\right)^2} . \end{aligned} \end{aligned}

因此 U,VU,V 独立。

习题3.3

旁注

多元正态的线性变换用协方差矩阵表述最清楚。线性变换后先算均值和协方差。

题目

(X,Y)(X,Y) 服从二元标准正态分布,求:(1)X+YX+YXYX-Y 的联合密度函数及边缘密度函数;(2)E[XYX+Y]\mathbb{E}[X-Y\mid X+Y]Var(XYX+Y)\operatorname{Var}(X-Y\mid X+Y)

证明

U=X+YU=X+YV=XYV=X-Y,并设

(X,Y)N(0,Σ).(X,Y)\sim N(0,\Sigma).

由于二维标准正态,记 Σ=(1ρρ1)\Sigma=\left(\begin{array}{cc} 1 & \rho \\ \rho & 1 \end{array}\right)。记 D=(1111)D=\left(\begin{array}{cc} 1 & 1\\ 1& -1 \end{array}\right)。则

(U,V)=(X,Y)D.(U,V)=(X,Y)D.

由讲义定理 3.3.3,

(U,V)N(0,DTΣD):=N(0,Σ).(U,V)\sim N(0,D^T\Sigma D):=N(0,\Sigma').

经计算,Σ=(2+2ρ0022ρ)\Sigma'=\left(\begin{array}{cc} 2+2\rho & 0 \\ 0& 2-2\rho \end{array}\right)。故 U,VU,V 独立,UN(0,2+2ρ)U\sim N(0,2+2\rho)VN(0,22ρ)V\sim N(0,2-2\rho)。 (2) 既然 U,VU,V 独立,

E[VU]=E[V]=0,Var(VU)=Var(V)=22ρ.\mathbb{E}[V\mid U]=\mathbb{E}[V]=0,\qquad \operatorname{Var}(V\mid U)=\operatorname{Var}(V)=2-2\rho.
题目

3. 设 X=(X1,X2,,Xn)X = (X_1, X_2, \cdots, X_n) 服从多元正态 N(0,Σ)N(0, \Sigma),这里正定矩阵 Σ=(σij)i,j=1n\Sigma = (\sigma_{ij})_{i,j=1}^n。证明

U=k=1nakXk 与 V=k=1nbkXk 独立当且仅当 j,k=1najbkσjk=0,U = \sum_{k=1}^n a_k X_k \text{ 与 } V = \sum_{k=1}^n b_k X_k \text{ 独立当且仅当 } \sum_{j,k=1}^n a_j b_k \sigma_{jk} = 0,

其中 a1,,an,b1,,bna_1, \cdots, a_n, b_1, \cdots, b_n 为实数。并在 b1,,bnb_1, \cdots, b_n 不全为零时,求条件期望 E[UV]\mathbb{E}[U \mid V]

证明

(1)多元正态分布的分量的线性组合仍构成多元正态分布,故 (U,V)(U,V) 满足二元正态分布。显然

E[U]=E[V]=0.\mathbb{E}[U]=\mathbb{E}[V]=0. U,V独立Cov(U,V)=0E[UV]=0j,k=1najbkE[XjXk]=0j,k=1najbkσjk=0\begin{aligned} &U,V\text{独立}\\ \Leftrightarrow &\operatorname{Cov}(U,V)=0\\ \Leftrightarrow &\mathbb{E}[UV]=0\\ \Leftrightarrow &\sum_{j,k=1}^n a_jb_k\mathbb{E}[X_jX_k] =0\\ \Leftrightarrow &\sum_{j,k=1}^n a_jb_k\sigma_{jk} =0\\ \end{aligned}

(2) 对于正态分布,因为不相关和独立性等价,所以

Cov(UCov(U,V)Var(V)V,V)=0\operatorname{Cov}(U-\frac{\operatorname{Cov}(U, V)}{\operatorname{Var}(V)}V , V)=0

进而有 UCov(U,V)Var(V)VU-\frac{\operatorname{Cov}(U,V)}{\operatorname{Var}(V)}VVV 独立。于是 E ⁣[UCov(U,V)Var(V)VV]=E ⁣[UCov(U,V)Var(V)V]=0\mathbb{E}\!\left[U-\frac{\operatorname{Cov}(U,V)}{\operatorname{Var}(V)}V\mid V\right]=\mathbb{E}\!\left[U-\frac{\operatorname{Cov}(U,V)}{\operatorname{Var}(V)}V\right]=0 由条件期望的线性性,得到

E[UV]=Cov(U,V)Var(V)V.\mathbb{E}[U \mid V] = \frac{\operatorname{Cov}(U, V)}{\operatorname{Var}(V)} \, V.

代入计算即可得:

E[UV]=j,kajbkσjkj,kbjbkσjkV\mathbb{E}[U \mid V] = \frac{\sum_{j,k} a_j b_k \sigma_{jk}}{\sum_{j,k} b_j b_k \sigma_{jk}} V
题目

X1,X2,,XnX_1,X_2,\cdots,X_n 独立同分布于 N(μ,σ2)N(\mu,\sigma^2)X=1ni=1nXi\overline{X}=\frac{1}{n}\sum_{i=1}^n X_i,求 ρ(X1,X)\rho(X_1,\overline{X})

证明

由题意,X1,X2,,XnX_1, X_2, \ldots, X_n 独立同分布,E(Xi)=μ\mathbb{E}(X_i)=\muVar(Xi)=σ2\operatorname{Var}(X_i) = \sigma^2

X=1nj=1nXj\overline{X} = \frac{1}{n} \sum_{j=1}^n X_j

首先计算协方差:

Cov(X1,X)=Cov(X1,1nj=1nXj)=1nj=1nCov(X1,Xj)\operatorname{Cov}(X_1, \overline{X}) = \operatorname{Cov}\left(X_1, \frac{1}{n} \sum_{j=1}^n X_j\right) = \frac{1}{n} \sum_{j=1}^n \operatorname{Cov}(X_1, X_j)

由于独立性,当 j1j \ne 1 时,Cov(X1,Xj)=0\operatorname{Cov}(X_1, X_j) = 0;当 j=1j = 1 时,Cov(X1,X1)=Var(X1)=σ2\operatorname{Cov}(X_1, X_1) = \operatorname{Var}(X_1) = \sigma^2

因此:

Cov(X1,X)=1nσ2=σ2n\operatorname{Cov}(X_1, \overline{X}) = \frac{1}{n} \cdot \sigma^2 = \frac{\sigma^2}{n}

再计算方差:

Var(X)=1n2j=1nVar(Xj)=1n2nσ2=σ2n\operatorname{Var}(\overline{X}) = \frac{1}{n^2} \sum_{j=1}^n \operatorname{Var}(X_j) = \frac{1}{n^2} \cdot n \sigma^2 = \frac{\sigma^2}{n} Var(X1)=σ2\operatorname{Var}(X_1) = \sigma^2

故相关系数:

ρ(X1,X)=Cov(X1,X)Var(X1)Var(X)=σ2nσ2σ2n=σ2nσ2n=1n\rho(X_1, \overline{X}) = \frac{\operatorname{Cov}(X_1, \overline{X})}{\sqrt{\operatorname{Var}(X_1) \operatorname{Var}(\overline{X})}} = \frac{\frac{\sigma^2}{n}}{\sqrt{\sigma^2 \cdot \frac{\sigma^2}{n}}} = \frac{\frac{\sigma^2}{n}}{\frac{\sigma^2}{\sqrt{n}}} = \frac{1}{\sqrt{n}}
题目

eeRn(n2)\mathbb{R}^n (n \geq 2) 中一个固定的单位向量,随机向量 XX 服从 nn 元正态分布 N(0,In)N(0, I_n),这里 InI_n 为单位矩阵。记 ZZeeXX 所在直线上投影长度的平方,试求 ZZ 的密度函数。

证明

投影向量长度的平方为:

Z=(eX)2X2Z = \frac{(e^\top X)^2}{\|X\|^2}

由于 XN(0,In)X \sim N(0, I_n),作正交变换(该变换可行,因为 XX 具有球对称性)使 ee 变为第一个坐标轴方向 (1,0,,0)(1,0,\ldots,0)^\top。记 Y=(Y1,Y2,,Yn)Y = (Y_1, Y_2, \ldots, Y_n)^\top 为变换后的向量,则 YN(0,In)Y \sim N(0, I_n),且

eX=Y1,X2=i=1nYi2.e^\top X = Y_1, \quad \|X\|^2 = \sum_{i=1}^n Y_i^2.

于是:

Z=Y12Y12+Y22++Yn2.Z = \frac{Y_1^2}{Y_1^2 + Y_2^2 + \cdots + Y_n^2}.

U=Y12χ12U = Y_1^2 \sim \chi^2_1V=Y22++Yn2χn12V = Y_2^2 + \cdots + Y_n^2 \sim \chi^2_{n-1},且 UUVV 独立。则:

Z=UU+V.Z = \frac{U}{U + V}.

对于 Uχa2U \sim \chi^2_aVχb2V \sim \chi^2_b 独立,有:

UU+VBeta(a2,b2).\frac{U}{U+V} \sim \operatorname{Beta}\left(\frac{a}{2}, \frac{b}{2}\right).

这里 a=1a = 1b=n1b = n-1,故:

ZBeta(12,n12).Z \sim \operatorname{Beta}\left(\frac{1}{2}, \frac{n-1}{2}\right).

其密度函数为:

fZ(z)=Γ(n2)Γ(12)Γ(n12)z121(1z)n121,0<z<1.f_Z(z) = \frac{\Gamma\left(\frac{n}{2}\right)}{\Gamma\left(\frac{1}{2}\right) \Gamma\left(\frac{n-1}{2}\right)} z^{\frac{1}{2} - 1} (1-z)^{\frac{n-1}{2} - 1}, \quad 0 < z < 1.

即:

fZ(z)=Γ(n2)πΓ(n12)z1/2(1z)n32,0<z<1,f_Z(z) = \frac{\Gamma\left(\frac{n}{2}\right)}{\sqrt{\pi} \, \Gamma\left(\frac{n-1}{2}\right)} z^{-1/2} (1-z)^{\frac{n-3}{2}}, \quad 0 < z < 1,

其他处为 0。

习题3.4

旁注

复高斯和 GOE 题多用不变性。先找对称性,往往比直接硬算密度更省力。

题目

ZNC(0,1)Z \sim N_C(0,1),证明

E[ZkZˉl]={k!,k=l,0,kl.\mathbb{E}[Z^k \bar{Z}^l] = \begin{cases} k! & , \quad k = l, \\ 0 & , \quad k \neq l. \end{cases}
证明
 利用 f(z)=1πez2, 有 E[ZkZˉl]=C1πez2zkzˉl dz=z=reiθ02π0+1πer2(reiθ)k(reiθ)lr dr dθ=02π0+1πrk+l+1ei(kl)θer2 dr dθ={20+r2k+1er2 dr=Γ(k+1)=k!,k=l0,kl.\begin{aligned} &\text { 利用 } f(z)=\frac{1}{\pi} \mathrm{e}^{-|z|^{2}} \text {, 有 }\\ & \mathbb{E}\left[Z^{k} \bar{Z}^{l}\right]=\int_{\mathbb{C}} \frac{1}{\pi} \mathrm{e}^{-|z|^{2}} z^{k} \bar{z}^{l} \mathrm{~d} z \\ &\stackrel{z=re^{i\theta}}{=} \int_{0}^{2 \pi} \int_{0}^{+\infty} \frac{1}{\pi} \mathrm{e}^{-r^{2}}\left(r \mathrm{e}^{\mathrm{i} \theta}\right)^{k}\left(r \mathrm{e}^{-\mathrm{i} \theta}\right)^{l} r \mathrm{~d} r \mathrm{~d} \theta \\ & =\int_{0}^{2 \pi} \int_{0}^{+\infty} \frac{1}{\pi} r^{k+l+1} \mathrm{e}^{i(k-l) \theta} \mathrm{e}^{-r^{2}} \mathrm{~d} r \mathrm{~d} \theta \\ & =\left\{\begin{array}{ll} 2 \int_{0}^{+\infty} r^{2 k+1} \mathrm{e}^{-r^{2}} \mathrm{~d} r=\Gamma(k+1)=k!\quad\quad\quad & ,k=l \\ 0 & ,k \neq l . \end{array}\right. \end{aligned}
题目

Z1,Z2NC(0,1)Z_1, Z_2 \sim N_C(0, 1) 且独立,

11Z1/Z2Z_1 / Z_2 的密度函数。

22 利用习题 3.4.1,对正整数 nn 求期望 E[Z1Z22n]\mathbb{E}[|Z_1 - Z_2|^{2n}]

证明

(1) 已知 Z1,Z2i.i.d.NC(0,1)Z_1, Z_2 \overset{\text{i.i.d.}}{\sim} N_\mathbb C(0,1),即

fZ1,Z2(z1,z2)=1π2ez12z22,z1,z2C.f_{Z_1, Z_2}(z_1, z_2) = \frac{1}{\pi^2} e^{-|z_1|^2 - |z_2|^2}, \quad z_1, z_2 \in \mathbb{C}.

W=Z1Z2,V=Z2.W = \frac{Z_1}{Z_2}, \quad V = Z_2.

则变换为

Z1=WV,Z2=V.Z_1 = WV, \quad Z_2 = V.

该变换的 Jacobian 行列式为 v2|v|^2。因此联合密度为

fW,V(w,v)=fZ1,Z2(wv,v)v2=1π2ewv2v2v2=v2π2ev2(1+w2).f_{W,V}(w, v) = f_{Z_1, Z_2}(wv, v) \cdot |v|^2 = \frac{1}{\pi^2} e^{-|wv|^2 - |v|^2} \cdot |v|^2 = \frac{|v|^2}{\pi^2} e^{-|v|^2(1 + |w|^2)}.

vv 积分得 WW 的边际密度:

fW(w)=CfW,V(w,v)dv.f_W(w) = \int_{\mathbb{C}} f_{W,V}(w, v) \, dv.

r=vr = |v|,则 dv=rdrdθdv = r \, dr \, d\theta,积分与 θ\theta 无关:

fW(w)=1π2002πr2er2(1+w2)rdθdr=2ππ20r3er2(1+w2)dr.f_W(w) = \frac{1}{\pi^2} \int_0^{\infty} \int_0^{2\pi} r^2 e^{-r^2(1+|w|^2)} \cdot r \, d\theta \, dr = \frac{2\pi}{\pi^2} \int_0^{\infty} r^3 e^{-r^2(1+|w|^2)} \, dr.

计算积分:令 a=1+w2a = 1+|w|^2t=r2t = r^2,则 r3dr=t2dtr^3 dr = \frac{t}{2} dt

0r3ear2dr=120teatdt=121a2=12a2.\int_0^{\infty} r^3 e^{-a r^2} dr = \frac{1}{2} \int_0^{\infty} t e^{-a t} dt = \frac{1}{2} \cdot \frac{1}{a^2} = \frac{1}{2a^2}.

代入得

fW(w)=2ππ212(1+w2)2=1π(1+w2)2.f_W(w) = \frac{2\pi}{\pi^2} \cdot \frac{1}{2(1+|w|^2)^2} = \frac{1}{\pi (1+|w|^2)^2}.

22 由于 Z1,Z2NC(0,1)Z_1, Z_2 \sim N_\mathbb C(0,1) 独立,有 Z1Z2NC(0,2)Z_1 - Z_2 \sim N_\mathbb C(0, 2)。令 Y=Z1Z22NC(0,1)Y = \frac{Z_1 - Z_2}{\sqrt{2}} \sim N_C(0,1)。则:

Z1Z22n=(2)nY2n=2n(YYˉ)n.|Z_1 - Z_2|^{2n} = (2)^{n} |Y|^{2n} = 2^n (Y \bar{Y})^n.

由习题 3.4.1(取 k=n,l=nk=n, l=n):

E[(YYˉ)n]=E[YnYˉn]=n!.\mathbb{E}[(Y \bar{Y})^n] = \mathbb{E}[Y^n \bar{Y}^n] = n!.

因此:

E[Z1Z22n]=2nn!.\mathbb{E}[|Z_1 - Z_2|^{2n}] = 2^n \cdot n!.
题目

4. (GOE 的矩) 设 HH 服从 GOEn_n 分布,令 ak=E[tr(Hk)]a_k = \mathbb{E}[\operatorname{tr}(H^k)]。计算出前 6 阶矩 ak,k=1,,6a_k, k = 1, \dots, 6

证明

由对称性,只考虑偶数阶矩。一般随机矩阵中 tr=1nTr\operatorname{tr}=\dfrac{1}{n}\operatorname{Tr},其中 Tr\operatorname{Tr}是迹运算,nn是矩阵维数,由对称性,只考虑偶数阶矩。由Wick公式

ETr(H2k)=i1,,i2kE(hi1i2hi2i3hi2ki1)=i1,,i2kπP(2k)(p,q)πE(hipip+1hiqiq+1)=i1,,i2kπP(2k)(p,q)πE(δipiqδip+1iq+1+δipiq+1δip+1iq)\begin{aligned} \mathbb{E}\operatorname{Tr}(H^{2k}) &=\sum_{i_1,\cdots , i_{2k}} \mathbb{E}( h_{i_1i_2}h_{i_2i_3}\cdots h_{i_{2k}i_1}) \\ &=\sum_{i_1,\cdots , i_{2k}} \sum_{\pi \in \mathcal{P}(2k)}\prod_{(p,q)\in \pi }\mathbb{E}(h_{i_pi_{p+1}}h_{i_qi_{q+1}})\\ &=\sum_{i_1,\cdots , i_{2k}} \sum_{\pi \in \mathcal{P}(2k)}\prod_{(p,q)\in \pi }\mathbb{E}(\delta_{i_pi_q}\delta_{i_{p+1}i_{q+1}}+\delta_{i_pi_{q+1}}\delta_{i_{p+1}i_q}) \end{aligned}

k=1:

a2=1ni1,i2E[hi1i2hi2i1]=1ni1,i2E[hi1i22]=1n(2n+(n2n))=n+1a_2 = \dfrac{1}{n}\sum_{i_1,i_2} \mathbb{E}[h_{i_1 i_2} h_{i_2 i_1}] = \dfrac{1}{n}\sum_{i_1,i_2} \mathbb{E}[h_{i_1 i_2}^2]=\dfrac{1}{n}(2n+(n^2-n))=n+1

k=2:

a4=1ni1,i2,i3,i4E[hi1i2hi2i3hi3i4hi4i1].a_4 = \dfrac{1}{n}\sum_{i_1,i_2,i_3,i_4} \mathbb{E}[h_{i_1i_2} h_{i_2i_3} h_{i_3i_4} h_{i_4i_1}].

Wick 公式给出 3 种配对

  • (1,2)(3,4)(1,2)(3,4):仅在 i1=i3i_1=i_3 时不为 00i1=i2=i3=i4i_1=i_2=i_3=i_4时贡献4,i1=i2i4i_1=i_2\neq i_4i1=i4i2i_1=i_4\neq i_2时贡献2,i1i2,i1i4i_1\neq i_2,i_1\neq i_4时贡献 11。因此总贡献:4n+2n(n1)+2n(n1)+n(n1)24n+2n(n-1)+2n(n-1)+n(n-1)^2

  • (1,3)(2,4)(1,3)(2,4):交错配对,当且仅当 i1=i3,i2=i4i_1=i_3,i_2=i_4 或者 i2=i3,i1=i4i_2=i_3,i_1=i_4 时不为 00,总贡献 4n+n(n1)=n2+3n4n+n(n-1)=n^2+3n

  • (1,4)(2,3)(1,4)(2,3):同第一种,贡献也是 n3+2n2+nn^3+2n^2+n

    计算得

a4=2n2+5n+5.a_4 = 2n^2 + 5n + 5.

k=3k=3:由轮换对称性,可以分成 55 种情况,对应的代表配对分别是:(1,2)(3,4)(5,6)(1,2)(3,4)(5,6)(1,2)(3,6)(4,5)(1,2)(3,6)(4,5)(1,2)(3,5)(4,6)(1,2)(3,5)(4,6)(1,3)(2,5)(4,6)(1,3)(2,5)(4,6)(1,4)(2,5)(3,6)(1,4)(2,5)(3,6)。每种情况分别有 2,3,6,3,12,3,6,3,1 种配对。下面,针对 (1,2)(3,4)(5,6)(1,2)(3,4)(5,6) 的详细过程: Ehi1i2hi2i30\mathbb{E} h_{i_1i_2}h_{i_2i_3} \neq 0 当且仅当 i1=i2,i2=i3i_1=i_2,i_2=i_3 或者 i1=i3i_1=i_3Ehi3i4hi4i50\mathbb{E} h_{i_3i_4}h_{i_4i_5} \neq 0 当且仅当 i3=i4,i4=i5i_3=i_4,i_4=i_5 或者 i3=i5i_3=i_5 Ehi5i6hi6i10\mathbb{E} h_{i_5i_6}h_{i_6i_1} \neq 0 当且仅当 i5=i6,i6=i1i_5=i_6,i_6=i_1 或者 i1=i5i_1=i_5 共有八种情况,每种情况贡献 11,例如都选后者算出的关系为:i1=i3=i5,i2,i4,i6i_1=i_3=i_5,i_2,i_4,i_6,共 n4n^4 种情况。同样算下去,结果为 n4+3n2+3n2+nn^4+3n^2+3n^2+n。 第二种配对:n4+3n3+3n2+nn^4+3n^3+3n^2+n 第三种配对:n3+4n2+3nn^3+4n^2+3n 第四种配对:3n2+5n3n^2+5n 第五种配对:n3+4n2+3nn^3+4n^2+3n 最后合计为:5n4+22n3+52n2+41n5n^4 +22n^3 +52n^2 +41n。 另外,M. Ledoux 在 “A recursion formula for the moments of the Gaussian orthogonal ensemble” 中给出了计算 GOE 精确矩的五项递推公式:记 E(Tr(H2p))=bpN=k1ηk(p)Nk\mathbb{E}(\operatorname{Tr}(H^{2p}))=b_p^N = \sum_{k \geq 1} \eta_k(p) N^k

(p+1)ηk(p)=(8p2)ηk1(p1)(4p1)ηk(p1)+p(2p3)(10p9)ηk(p2)8(2p3)ηk2(p2)+8(2p3)ηk1(p2)10(2p3)(2p4)(2p5)ηk1(p3)+5(2p3)(2p4)(2p5)ηk(p3)2(2p3)(2p4)(2p5)(2p6)(2p7)ηk(p4)\begin{aligned} (p + 1)\eta_k(p) &= (8p - 2)\eta_{k-1}(p - 1) - (4p - 1)\eta_k(p - 1) \\ &\quad + p(2p - 3)(10p - 9)\eta_k(p - 2) - 8(2p - 3)\eta_{k-2}(p - 2) \\ &\quad + 8(2p - 3)\eta_{k-1}(p - 2) - 10(2p - 3)(2p - 4)(2p - 5)\eta_{k-1}(p - 3) \\ &\quad + 5(2p - 3)(2p - 4)(2p - 5)\eta_k(p - 3) \\ &\quad - 2(2p - 3)(2p - 4)(2p - 5)(2p - 6)(2p - 7)\eta_k(p - 4) \end{aligned}
题目

假设 {xij}i,j=1n\{x_{ij}\}_{i,j=1}^n 独立同分布 N(0,1)N(0,1),令

Xn=(xij)i,j=1n,X_n = (x_{ij})_{i,j=1}^n,

构造对称矩阵

H=12(Xn+Xnt),H = \frac{1}{\sqrt{2}}(X_n + X_n^t),

试证明 HH 服从 GOE 分布。

证明

由于 H=12(Xn+Xnt)H = \frac{1}{\sqrt{2}}(X_n + X_n^t),其矩阵元为

Hij=12(xij+xji).H_{ij} = \frac{1}{\sqrt{2}}(x_{ij} + x_{ji}).

{xij}\{x_{ij}\} 独立同分布于 N(0,1)N(0,1),可计算 HH 各矩阵元的分布。 对角元 HiiH_{ii}

Hii=12(xii+xii)=2xii.H_{ii} = \frac{1}{\sqrt{2}}(x_{ii} + x_{ii}) = \sqrt{2}\,x_{ii}.

因为 xiiN(0,1)x_{ii} \sim N(0,1),所以

HiiN(0,2).H_{ii} \sim N(0,2).

非对角元 HijH_{ij}i<ji < j):

Hij=12(xij+xji).H_{ij} = \frac{1}{\sqrt{2}}(x_{ij} + x_{ji}).

由于 xijx_{ij}xjix_{ji} 独立且均服从 N(0,1)N(0,1),它们的和服从 N(0,2)N(0,2),乘以 1/21/\sqrt{2} 后得

HijN(0,1).H_{ij} \sim N(0,1).

独立元共 nn 个对角元与 n(n1)2\frac{n(n-1)}{2} 个非对角元,总计 n(n+1)2\frac{n(n+1)}{2} 个。

联合密度为各独立元密度的乘积:

f(H)=i=1n12π2exp(Hii24)×i<j12πexp(Hij22)=2n2(2π)n(n+1)4exp(14i=1nHii212i<jHij2).\begin{aligned} f(H) &= \prod_{i=1}^n \frac{1}{\sqrt{2\pi \cdot 2}} \exp\left(-\frac{H_{ii}^2}{4}\right) \times \prod_{i<j} \frac{1}{\sqrt{2\pi}} \exp\left(-\frac{H_{ij}^2}{2}\right) \\ &= 2^{-\frac{n}{2}} (2\pi)^{-\frac{n(n+1)}{4}} \exp\left(-\frac{1}{4}\sum_{i=1}^n H_{ii}^2 - \frac{1}{2}\sum_{i<j} H_{ij}^2\right). \end{aligned}

注意到

14i=1nHii2+12i<jHij2=14tr(H2),\frac{1}{4}\sum_{i=1}^n H_{ii}^2 + \frac{1}{2}\sum_{i<j} H_{ij}^2 = \frac{1}{4}\operatorname{tr}(H^2),

f(H)=2n2(2π)n(n+1)4e14tr(H2).f(H) = 2^{-\frac{n}{2}} (2\pi)^{-\frac{n(n+1)}{4}} e^{-\frac{1}{4}\operatorname{tr}(H^2)}.
题目

(GOE 的正交不变性) 设 HH 服从 GOE 分布,证明任给正交矩阵 QQQHQ1QHQ^{-1} 也服从 GOE 分布。

证明

HGOEnH \sim \text{GOE}_n,其联合密度为

f(H)=Cne14tr(H2),f(H) = C_n \cdot e^{-\frac{1}{4}\operatorname{tr}(H^2)},

其中 Cn=2n2(2π)n(n+1)4C_n = 2^{-\frac{n}{2}} (2\pi)^{-\frac{n(n+1)}{4}}

H~=QHQ1=QHQt\tilde{H} = QHQ^{-1} = QHQ^t(因 QQ 为正交矩阵)。

对称性:

H~t=(QHQt)t=QHtQt=QHQt=H~,\tilde{H}^t = (QHQ^t)^t = QH^tQ^t = QHQ^t = \tilde{H},

所以 H~\tilde{H} 仍是实对称矩阵。

迹的不变性:

tr(H~2)=tr(QHQtQHQt)=tr(QH2Qt)=tr(H2QtQ)=tr(H2).\operatorname{tr}(\tilde{H}^2) = \operatorname{tr}(QHQ^t QHQ^t) = \operatorname{tr}(QH^2Q^t) = \operatorname{tr}(H^2 Q^t Q) = \operatorname{tr}(H^2).

因此密度函数中的指数部分不变:

exp(14tr(H~2))=exp(14tr(H2)).\exp\left(-\frac{1}{4}\operatorname{tr}(\tilde{H}^2)\right) = \exp\left(-\frac{1}{4}\operatorname{tr}(H^2)\right).

变换的 Jacobian 行列式: H~=QHQt\tilde{H} = QHQ^t 是一个线性变换,因此存在矩阵 AA 使得 Vec(H~)=AVec(H)\operatorname{Vec}(\tilde{H})=A\operatorname{Vec}(H),其中 Vec\operatorname{Vec} 是把矩阵拉长为 n2n^2 维向量。一个矩阵正交当且仅当其保持任意向量的 2-范数,因此

Vec(H~)22=tr(H~2)=tr(H2)=Vec(H)22\|\operatorname{Vec}(\tilde{H})\|_2^2=\operatorname{tr}(\tilde{H}^2)=\operatorname{tr}(H^2)=\|\operatorname{Vec}(H)\|_2^2

因此 AA 正交。故其 Jacobian 行列式的绝对值为 11。 变换后 H~\tilde{H} 的密度为

f(H~)=f(H)det(J)1=f(H)=Cne14tr(H~2).f(\tilde{H}) = f(H) \cdot |\det(J)|^{-1} = f(H) = C_n \cdot e^{-\frac{1}{4}\operatorname{tr}(\tilde{H}^2)}.

因此 H~=QHQ1\tilde{H} = QHQ^{-1} 同样服从 GOE 分布。\square

习题4.1

旁注

这一节准备尾积分、Jensen 和矩界;后面会把它们转成概率界。

题目

对非负随机变量 XX,证明

n=1P(Xn)E[X]n=1P(Xn)+1.\sum_{n=1}^\infty \mathbb{P}(X \geq n) \leq \mathbb{E}[X] \leq \sum_{n=1}^\infty \mathbb{P}(X \geq n) + 1.
证明

注意,对非负随机变量XX,我们有,

X=i=0X1iX<i+1.X=\sum_{i=0}^{\infty} X\mathbb 1_{i\leq X<i+1}.

同时显然我们有,

i1iX<i+1X1iX<i+1(i+1)1iX<i+1.i\mathbb{1}_{i\leq X<i+1}\leq X\mathbb{1}_{i\leq X<i+1} \leq (i+1)\mathbb{1}_{i\leq X<i+1}.

故,

E[X]=i=0E[X1iX<i+1]i=0(i+1)E[1iX<i+1]1+i=0iE[1iX<i+1]1+i=1j=1iE[1iX<i+1]累和号换序.1+j=1i=jE[1iX<i+1]1+j=1P(Xj).\begin{aligned} \mathbb{E}[X]=&\sum_{i=0}^{\infty} \mathbb{E}[X\mathbb{1}_{i\leq X<i+1}]\\ \leq & \sum_{i=0}^{\infty} (i+1)\mathbb{E}[\mathbb{1}_{i\leq X<i+1}]\\ \leq & 1+\sum_{i=0}^{\infty} i\mathbb{E}[\mathbb{1}_{i\leq X<i+1}]\\ \leq & 1+\sum_{i=1}^{\infty} \sum_{j=1} ^i \mathbb{E}[\mathbb{1}_{i\leq X<i+1}]\\ &\text{累和号换序.}\\ \leq & 1+\sum_{j=1}^{\infty} \sum_{i=j} ^{\infty} \mathbb{E}[\mathbb{1}_{i\leq X<i+1}]\\ \leq & 1+\sum_{j=1}^{\infty} \mathbb{P}(X\geq j).\\ \end{aligned}

另一侧同理.

题目

(Jensen 不等式) 称函数 u:RRu : \mathbb{R} \to \mathbb{R} 为凸的,若对任意 aRa \in \mathbb{R} 存在 λ=λa\lambda = \lambda_a 使得

u(x)u(a)+λa(xa),xR.u(x) \geq u(a) + \lambda_a (x - a), \quad \forall x \in \mathbb{R}.

称凸函数 uu 是严格凸的,若 λa\lambda_a 关于 aa 严格单调递增。

  1. 证明对于凸函数 uu 与期望存在的随机变量 XX,有 E[u(X)]u(E[X])\mathbb{E}[u(X)] \geq u(\mathbb{E}[X])

  2. 证明若 uu 是严格凸的且 E[u(X)]=u(E[X])\mathbb{E}[u(X)] = u(\mathbb{E}[X]),则 XX 以概率 11 为常数。

证明

(1)取a=E[X],a=\mathbb{E}[X],由凸函数定义,

E[u(X)]E[u(a)+λa(Xa)]=u(a)+λa(E[X]a)=u(a)=u(E[X]).\mathbb{E}[u(X)]\geq \mathbb{E}[u(a)+\lambda_a(X-a) ]=u(a)+\lambda_a(\mathbb{E}[X]-a)=u(a)=u(\mathbb{E}[X]).

(2)不等号取等当且仅当X=E[X]a.e.X=\mathbb{E}[X]\quad a.e.,即XX以概率11为常数.

题目

XX 为非负随机变量,证明对任意 r>0r > 0 均有

E[Xr]=0rxr1P(X>x)dx.\mathbb{E}[X^r] = \int_0^\infty r x^{r-1} \mathbb{P}(X > x) \, dx.
证明
E[Xr]=E0Xrtr1dt=E0rtr11X>tdt使用Fubini定理交换积分顺序.=0rtr1E[1X>t]dt=0rtr1P(X>t)dt.\begin{aligned} \mathbb{E} [X^{r}] & =\mathbb{E} \int_{0}^{X} rt^{r-1} d t \\ & =\mathbb{E} \int_{0}^{\infty} r t^{r-1} \mathbb{1}_{X>t} d t \\ & \text{使用Fubini定理交换积分顺序.} \\ & =\int_{0}^{\infty} r t^{r-1} \mathbb{E}[\mathbb{1}_{X>t}] d t \\ & =\int_{0}^{\infty} r t^{r-1} \mathbb{P}(X>t) d t. \end{aligned}
题目

给定 r>0r > 0

  1. E[Xr]<\mathbb{E}[|X|^r] < \infty 时,证明
limx+xrP(Xx)=0.\lim_{x \to +\infty} x^r \mathbb{P}(|X| \geq x) = 0.
limx+xrP(Xx)=0,\lim_{x \to +\infty} x^r \mathbb{P}(|X| \geq x) = 0,

证明 E[Xs]<\mathbb{E}[|X|^s] < \inftys(0,r)\forall s \in (0, r)。并问 E[Xr]<\mathbb{E}[|X|^r] < \infty 是否成立?请说明理由或给出反例。

证明

(1)易知,

xrP(Xx)=xrR1XxdPRXr1XxdP.x^r \mathbb{P}(|X|\geq x)=x^r\int _{\mathbb R} \mathbb{1}_{|X|\geq x} d \mathbb{P} \leq \int _{\mathbb R } |X|^r\mathbb{1}_{|X|\geq x} d \mathbb{P}.

另一方面,Xr1XxXr,|X|^r\mathbb{1}_{|X|\geq x} \leq |X|^r,同时Xr|X|^r可积(E[Xr]<)(\mathbb{E}[|X|^r]<\infty),由 DCT.

limnRXr1XndP=RlimnXr1XndP=R0dP=0.\lim _{n\to \infty} \int _{\mathbb R} |X|^r\mathbb{1}_{|X|\geq n} d \mathbb{P}=\int _{\mathbb R}\lim _{n\to \infty} |X|^r\mathbb{1}_{|X|\geq n} d \mathbb{P}=\int _{\mathbb R }0 d \mathbb{P}=0.

综上,证毕. (2)ε>0,\forall \varepsilon>0,MM使得x>M,xrP(Xx)<ε.\forall x>M,x^r \mathbb{P}(|X|\geq x)<\varepsilon. 由上题结论,

E[Xs]=0sts1P(X>t)dt=0Msts1P(X>t)dt+Msts1P(X>t)dt=C1+Msts1εtrdt=C1+C2ε.\begin{aligned} \mathbb{E}[|X|^s]= &\int_{0}^{\infty} s t^{s-1} \mathbb{P}(|X|>t) d t\\ =& \int_{0}^{M} s t^{s-1} \mathbb{P}(|X|>t) d t+ \int^{\infty}_{M} s t^{s-1} \mathbb{P}(|X|>t) d t\\ =& C_1+ \int^{\infty}_{M} s t^{s-1} \frac{\varepsilon}{ t^r } d t\\ =& C_1+ C_2\varepsilon. \end{aligned}

E[Xs]<\mathbb{E}[|X|^s]<\infty。 此时并不一定有 E[Xr]<\mathbb{E}[|X|^r]<\infty,取 P(Xx)1xrlogx\mathbb{P}(|X|\geq x)\sim \frac{1}{x^r\log x},利用上题公式验证即知 E[Xr]\mathbb{E}[|X|^r] 发散。

习题3.5

旁注

正态尾概率的量级是 ex2/2/xe^{-x^2/2}/x。分部积分是这里的主要工具。

题目

标准正态分布的尾概率估计,对于 XN(0,1)X\sim N(0,1),那么

xx2+112πex2/2P(Xx)1x12πex2/2\dfrac{x}{x^2+1}\dfrac{1}{\sqrt{2\pi }}e^{-x^2/2}\leq \mathbb{P}(X\geq x)\leq \dfrac{1}{x}\dfrac{1}{\sqrt{2\pi }}e^{-x^2/2}
证明

右边的估计来自于 E(1Xx)E(Xx1Xx)\mathbb{E}(\mathbb{1}_{X\geq x})\leq \mathbb{E}(\dfrac{X}{x}\mathbb{1}_{X\geq x})进而有:

P{X>x}12πxuxeu2/2du=1x12πex2/2.\mathbb{P}\{X > x\} \leq \frac{1}{\sqrt{2\pi}} \int_x^\infty \frac{u}{x} e^{-u^2/2} \, du = \frac{1}{x} \frac{1}{\sqrt{2\pi}} e^{-x^2/2}.

对于左边的等式,定义

f(x)=xex2/2(x2+1)xeu2/2du.f(x) = x e^{-x^2/2} - (x^2 + 1) \int_x^\infty e^{-u^2/2} \, du.

f(0)<0f(0) < 0limxf(x)=0\lim_{x \to \infty} f(x) = 0. 以及

f(x)=(1x2+x2+1)ex2/22xxeu2/2du=2x(xeu2/2duex2/2x),f'(x) = (1 - x^2 + x^2 + 1) e^{-x^2/2} - 2x \int_x^\infty e^{-u^2/2} \, du = -2x \left( \int_x^\infty e^{-u^2/2} \, du - \frac{e^{-x^2/2}}{x} \right),

x>0x>0f>0f^{\prime}>0,进而 f(x)0f(x)\leq 0

题目
  1. 定义函数 Hn,n0,H0=1,(1)nHnϕ=ϕ(n)H_n, n \geq 0, H_0 = 1, (-1)^n H_n \phi = \phi^{(n)},证明 Hn(x)H_n(x) 是主项为 xnx^nnn 次多项式,且满足正交关系:
+Hm(x)Hn(x)ϕ(x)dx={m!,m=n,0,mn.\int_{-\infty}^{+\infty} H_m(x) H_n(x) \phi(x) \, dx = \begin{cases} m!, & m = n, \\ 0, & m \neq n. \end{cases}

并证明

n=0Hn(x)tnn!=ext12t2.\sum_{n=0}^\infty H_n(x) \frac{t^n}{n!} = e^{xt - \frac{1}{2}t^2}.
解答

由定义 (1)nHn(x)ϕ(x)=ϕ(n)(x)(-1)^n H_n(x) \phi(x) = \phi^{(n)}(x),其中 ϕ(x)=12πex2/2\phi(x) = \frac{1}{\sqrt{2\pi}} e^{-x^2/2}。计算 ϕ=xϕ\phi^{\prime}=-x\phiϕ=ϕ+x2ϕ\phi^{\prime\prime}=-\phi+x^2\phi^{\prime}。通过归纳法可以得到 Hn(x)=Hn1(x)+xHn1(x)H_n(x)=-H_{n-1}^{\prime}(x)+xH_{n-1}(x)。可以看出 HnH_n 是最高项为 xnx^n 的首一多项式。

正交性:设 mnm \geq n

HmHnϕdx=(1)nHmϕ(n)dx.\int H_m H_n \phi \, dx = (-1)^n \int H_m \phi^{(n)} \, dx.

分部积分 nn 次,若 nmn \geq m,边界项为零得

(1)nHmϕ(n)dx=Hm(n)ϕdx.(-1)^n \int H_m \phi^{(n)} \, dx = \int H_m^{(n)} \phi \, dx.

Hm(n)H_m^{(n)}m=nm=n 时为非零常数 n!n!,且 ϕ=1\int \phi=1,故得证。 由 Taylor 展开

ϕ(xt)=n=0(t)nn!ϕ(n)(x).\phi(x-t) = \sum_{n=0}^\infty \frac{(-t)^n}{n!} \phi^{(n)}(x).

ϕ(xt)=12πe(xt)2/2=ϕ(x)extt2/2\phi(x-t) = \frac{1}{\sqrt{2\pi}} e^{-(x-t)^2/2} = \phi(x) e^{xt - t^2/2}。 代入 ϕ(n)(x)=(1)nHn(x)ϕ(x)\phi^{(n)}(x) = (-1)^n H_n(x) \phi(x),消去 ϕ(x)\phi(x)即可。

题目
  1. 对任意正整数 m,nm, n,计算相关系数 ρ(Hm(X),Hn(Y))\rho(H_m(X), H_n(Y))
解答

由(1)中母函数展开

eXtt22=i=0Hi(X)tii!,eYss22=j=0Hj(Y)sjj!.e^{Xt - \frac{t^2}{2}} = \sum_{i=0}^\infty H_i(X) \frac{t^i}{i!}, \quad e^{Ys - \frac{s^2}{2}} = \sum_{j=0}^\infty H_j(Y) \frac{s^j}{j!}.

首先,取期望得

E(eXtt22)=et22E(etX)=et22et22=1,\mathbb{E}\bigl(e^{Xt - \frac{t^2}{2}}\bigr) = e^{-\frac{t^2}{2}} \mathbb{E}(e^{tX}) = e^{-\frac{t^2}{2}} \cdot e^{\frac{t^2}{2}} = 1,

对照展开式 E(iHi(X)tii!)=iE(Hi(X))tii!=1\mathbb{E}\bigl(\sum_i H_i(X) \frac{t^i}{i!}\bigr) = \sum_i \mathbb{E}(H_i(X)) \frac{t^i}{i!} = 1, 比较系数得 E(H0(X))=1\mathbb{E}(H_0(X)) = 1,且对 n1n \geq 1E(Hn(X))=0\mathbb{E}(H_n(X)) = 0

其次,考虑联合母函数

E(eXtt22eYss22)=et2+s22E(etX+sY).\mathbb{E}\bigl(e^{Xt - \frac{t^2}{2}} \cdot e^{Ys - \frac{s^2}{2}}\bigr) = e^{-\frac{t^2 + s^2}{2}} \mathbb{E}\bigl(e^{tX + sY}\bigr).

由于 (X,Y)(X, Y) 服从标准二元正态,tX+sYN(0,t2+s2+2ρts)tX + sY \sim N(0, t^2 + s^2 + 2\rho ts),故

E(etX+sY)=e12(t2+s2+2ρts),\mathbb{E}\bigl(e^{tX + sY}\bigr) = e^{\frac{1}{2}(t^2 + s^2 + 2\rho ts)},

因此

E(eXtt22eYss22)=et2+s22e12(t2+s2+2ρts)=eρts.\mathbb{E}\bigl(e^{Xt - \frac{t^2}{2}} \cdot e^{Ys - \frac{s^2}{2}}\bigr) = e^{-\frac{t^2 + s^2}{2}} \cdot e^{\frac{1}{2}(t^2 + s^2 + 2\rho ts)} = e^{\rho ts}.

另一方面,将母函数展开代入:

E(i=0Hi(X)tii!j=0Hj(Y)sjj!)=i,j=0E[Hi(X)Hj(Y)]tisji!j!=eρts=n=0(ρts)nn!=n=0ρntnsnn!.\mathbb{E}\left( \sum_{i=0}^\infty H_i(X) \frac{t^i}{i!} \sum_{j=0}^\infty H_j(Y) \frac{s^j}{j!} \right) = \sum_{i,j=0}^\infty \mathbb{E}[H_i(X) H_j(Y)] \frac{t^i s^j}{i! j!} = e^{\rho ts} = \sum_{n=0}^\infty \frac{(\rho ts)^n}{n!} = \sum_{n=0}^\infty \rho^n \frac{t^n s^n}{n!}.

比较 tisjt^i s^j 的系数,得到

E[Hi(X)Hj(Y)]={ρnn!,i=j=n,0,ij.\mathbb{E}[H_i(X) H_j(Y)] = \begin{cases} \rho^n \cdot n!, & i = j = n, \\ 0, & i \neq j. \end{cases}

结合 E(Hn(X))=E(Hn(Y))=0\mathbb{E}(H_n(X)) = \mathbb{E}(H_n(Y)) = 0 (n1n \geq 1) 以及方差

Var(Hn(X))=E[Hn2(X)]02=n!,\operatorname{Var}(H_n(X)) = \mathbb{E}[H_n^2(X)] - 0^2 = n!,

可得相关系数

ρ(Hm(X),Hn(Y))=E[Hm(X)Hn(Y)]Var(Hm(X))Var(Hn(Y))={ρn,m=n1,0,mn.\rho(H_m(X), H_n(Y)) = \frac{\mathbb{E}[H_m(X) H_n(Y)]}{\sqrt{\operatorname{Var}(H_m(X)) \operatorname{Var}(H_n(Y))}} = \begin{cases} \rho^n, & m = n \geq 1, \\ 0, & m \neq n. \end{cases}
题目
  1. P(x),Q(y)P(x), Q(y) 为非常数多项式,试证明
ρ(P(X),Q(Y))ρ(X,Y).|\rho(P(X), Q(Y))| \leq |\rho(X, Y)|.
解答

P,QP, Q 用 Hermite 多项式展开:

P(x)=i=1kaiHi(x),Q(y)=j=1lbjHj(y).P(x) = \sum_{i=1}^k a_i H_i(x), \quad Q(y) = \sum_{j=1}^l b_j H_j(y).

常数项不影响协方差。由 (2) 知

Cov(P(X),Q(Y))=i=1min(k,l)aibii!ρi.\operatorname{Cov}(P(X), Q(Y)) = \sum_{i=1}^{\min(k,l)} a_i b_i i! \rho^i.

方差

Var(P(X))=i=1kai2i!,Var(Q(Y))=j=1lbj2j!.\operatorname{Var}(P(X)) = \sum_{i=1}^k a_i^2 i!, \quad \operatorname{Var}(Q(Y)) = \sum_{j=1}^l b_j^2 j!.

需证

iaibii!ρiρiai2i!ibi2i!.\left| \sum_{i} a_i b_i i! \rho^i \right| \leq |\rho| \sqrt{\sum_i a_i^2 i!} \sqrt{\sum_i b_i^2 i!}.

由 Cauchy-Schwarz 不等式与 ρiρ|\rho|^i \leq |\rho|(对 i1,ρ<1i \geq 1, |\rho| < 1):

i=1aibii!ρii=1aibii!ρiρi=1(aii!)(bii!)ρi=1ai2i!i=1bi2i!.\begin{aligned} \left| \sum_{i=1} a_i b_i i! \rho^i \right| &\leq \sum_{i=1} |a_i| |b_i| i! |\rho|^i \\ &\leq |\rho| \sum_{i=1} (|a_i|\sqrt{i!})(|b_i|\sqrt{i!}) \\ &\leq |\rho| \sqrt{\sum_{i=1} a_i^2 i!} \sqrt{\sum_{i=1} b_i^2 i!}. \end{aligned}

即得 ρ(P,Q)ρ|\rho(P,Q)| \leq |\rho|(这里 ρ=ρ(X,Y)|\rho| = |\rho(X,Y)|)。

章末回看
  • 本章原始题目和解答正文来自对应 TeX 分文件。
  • 可先只看题目框,写出关键等式后再展开证明或解答。
  • 若结论用到独立性、可列可加性、换元公式或矩条件,最好顺手标明。