第三次习题课
目录
- 本章围绕离散随机变量、期望、条件期望、概率方法和期中复习展开。
- 线性性、示性函数分解和条件分布是反复出现的三种工具。
- 随机游走、Catalan 数与分布函数刻画部分适合放慢速度读。
提示 遇到复杂随机量,先尝试写成示性函数之和,再决定是否需要独立性。
习题2.1
本节主要是分布列、混合分布和对称性。先条件化再求和;独立性常用来把边缘对称传到和上。
先掷一个均匀骰子,记下点数后再掷同样个数的均匀硬币,令 表示正面朝上的硬币个数,求 的分布列。
证明
设掷骰子得到点数,则独立。 的所有可能取值为,且
微信朋友圈单位时间分享的讯息条数服从参数为 的泊松分布,若在相邻时间间隔内新增讯息条数是相互独立的,求在两个单位的间隔时间内发现 条讯息的概率。
证明
记两个单位时间发送条数为。
设离散型随机变量 相互独立且关于 对称,即 与 有相同的分布列。证明对任意 ,
其中
若去掉相互独立这一条件,结论还一定成立吗?请说明理由。
证明
但若不独立,令,取以下分布,
则 都服从 上的均匀分布,因而都关于 对称,但
随机变量 的分布列 , , Shannon 信息熵定义为
给定 , 服从什么样的分布时信息熵 最大?
证明
由Jensen不等式,
等号成立时,,即为离散型均匀分布。
习题2.2
期望题常用生成函数、尾和公式和示性函数。高阶矩可以先试着拆成 Bernoulli 指示量。
对 ,求 。
证明
设, i.i.d.是示性随机变量,且,则
离散型随机变量 的分布列
讨论实数 取何值时 阶矩(当 非整数时称为分数阶矩)?
证明
当时,
当时,
故取值范围为。
无人驾驶网约车是当今社会的科技结晶,设一辆无人驾驶网约车一天内穿过的路口总数为 ,且
每个路口的红绿灯是独立工作的,该车在每个路口遇到红灯的概率是 。
求此出租车穿过路口总数的期望和方差。
求此出租车一天内遇到红灯数的期望。
证明
记 ,则由
求导得
于是
又
故
从而
设一天内遇到红灯数为 ,则在 的条件下,,故
于是
上面的 实际上服从参数为 的几何分布。有结论(可直接引用)
对非负整值随机变量 ,证明
证明
由 且取整数值,
两边取期望,并交换求和与期望,得
对非负实值随机变量 ,由
并对 分别应用上题,可得
故
这个不等式非常重要,它给出了随机变量数学期望的一个简单而且比较紧的估计。
随机图模型 指 个顶点 的图,两个顶点以概率 连边,且每两个顶点是否连边相互独立。顶点 的度 定义为与 相连的边数。
求 的分布列与期望 。
若 表示 中"三角形"个数,试求"三角形"期望数 和方差 。
证明
对固定顶点 , 是其余 条边中出现的条数,故
记所有三角形的集合为 ,对每个 ,记 为"三角形 出现"的示性函数,则
于是
再看方差,
其中
若两个不同三角形没有公共边,则对应边集独立,协方差为 ;若共用两条边时,
而共用一条边的三角形对数为
故
习题2.3
概率方法通常先随机化构造,再用期望推出存在性。结论是确定性的,随机性只是证明工具。
Daniel Bernoulli 在 1769 年描述了"扩散模型":A 瓶有 个红球,B 瓶有 个蓝球,每次从两瓶中各选一个球并相互交换。求进行 次操作后 A 瓶中的红球数的期望。
证明
对于A瓶初始的每一个球,先求第次交换后仍在A瓶的概率,则,且
得
因此对A瓶原来的个球编号,第个球第次交换后在瓶个数为,则,
设 是有限图,其中 是 的顶点集, 是 的边集。对任意顶点集 和任一边 ,定义示性函数
设
利用概率方法证明存在 使得 。
证明
我们独立地取的每个点,取每个点概率为,记取出的顶点集,随机变量,则
故存在一种取法使得。
一个盒子里有标号为 的 个球。现从中不放回地随机取出 个球并把它们的标号相加得到和数。求该和数的期望和方差。
证明
记和数为 ,对每个 ,记
则
由于每个球被取到的概率都为,故
再求方差. 由
先有
对,有
故
于是
设 个向量 满足 。令
利用概率方法证明存在 ,使得
证明
独立地取其中取的概率为, 考虑随机变量
有
故存在一种选取方式,使得,即
习题2.4
这里先按离散情形理解条件期望:给定信息后的平均值,并满足线性性、保正性和塔式法则。
证明条件期望的如下性质:
。
若 ,则 。
。
若 与 相互独立,则 。
,其中函数 使得等式两边的表达式均有意义。
证明
对任意满足 的 ,按定义
只需对每个这样的分别证明。
若 ,则
若 与 相互独立,则
故
由于在条件 下, 是常数,故
上面各式对任意 都成立,故结论成立。
设 和 相互独立,分别服从参数为 和 的 Poisson 分布。求条件期望 。
证明
记 ,则对 ,
故在 条件下, 服从参数为 的二项分布,从而
即
设离散型随机变量 的期望均为 ,方差均为 ,协方差为 。证明
证明
注意到
故
由 Cauchy 不等式,
又
于是
从而
通常定义 关于 的条件方差 为条件分布 的方差,由常用公式
我们也可直接定义,
根据上述定义,证明
证明
由定义,
而
故
另一方面,
两式相加即得
2024 年诺贝尔物理学奖授予 Hopfield 和 Hinton,表彰他们利用人工神经网络进行机器学习的基础性发现和发明。Hinton 在 Hopfield 网络想法基础上引入了玻尔兹曼机:给定连接两点间权重 ,定义取值于 的 维随机向量
的联合概率
这里配分函数为
表示 去掉第 个分量后的向量,试证明条件期望
证明
对任意给定的 ,记
当 固定时,联合概率中与 无关的部分可并入常数 ,从而
于是
又因为 只取 两个值,故
即
习题2.5
不等式题要看清用了 Cauchy、Jensen、Markov、Chebyshev 还是 Chernoff;等号条件往往也很重要。
直线上简单随机游走
这里
求 .
证明
先记
因此
又由独立性,
最后求条件期望。
若 ,则
而后面这段与 独立,故
若 ,则在给定 的条件下, 的地位完全对称,故
又
所以
从而
综上,
在一次只有两个候选人的选举中,每次投票只投给一位候选人且不能弃票。已知最后投票结果 得 张选票, 得 张选票,且 ,投票过程中出现的各种情况可能性相同。
-
求计票过程中出现两人票数相等的概率。
-
证明计票过程中 从不落后于 的概率为
证明
仿照课本例2.5.4,构造随机游走,令
则前 张票计完后, 比 多出的票数就是 。每一种计票次序都对应一条从 到 的轨道,且这些轨道等可能;轨道总数为
"计票过程中出现两人票数相等"就是轨道在出发后再次经过 轴。
若 ,则终点就在 轴上,故所求概率为 。
若 ,则其对立事件是"轨道不再过 轴",也就是计票过程中 始终领先于 。由投票定理,
因此
当 时,此式也仍为 。
" 从不落后于 "就是对一切 都有 。
把每一条这样的轨道最前面补上一条向上的边,就得到一条从 到 且不再过 轴的轨道;反过来,删去第一步也可恢复原轨道,所以这是一个一一对应。
于是由投票定理,
又
故
再除以总轨道数 ,得
直线上简单对称随机游走 。设
为第一次回到出发点的时刻。证明
并讨论 取何值时 。
注. 可以利用 Stirling 公式:。
证明
显然 只能取偶数。记
由对称性,
现在来数满足 的轨道。若 且第一步走到 ,则
把这条轨道倒过来读,便得到一条从 到 且在出发后不再过 轴的轨道;反过来也可以恢复原轨道,所以这是一个一一对应。
由投票定理,
每条长为 的轨道概率都是 ,故
下面讨论 。由 Stirling 公式,
从而
因此
而幂级数 收敛当且仅当
即
故
考虑一质点,它沿着按一个圆周排列的标以 的 个节点移动。在每一步质点等概率按顺时针或逆时针方向移动至下一个位置。现在质点从 出发按上述规则移动,直到节点 均被访问过为止。
-
证明质点以概率 访问所有点 。
-
求最后一个被访问的节点是 的概率。
证明
(1) 对每个固定的 ,记, 再对每个 ,记
无论第 步末质点在哪个节点,总可以选定一个方向,使其在接下来的至多 步内到达 ;这一特定走法的条件概率至少为 。因此
从而对任意 ,
若 发生,则每一段长为 的时间里都不会访问到 ,故对任意 ,
从而
令 ,得 。这对每个 都成立。由于只有有限个点,
故质点以概率 访问所有点 。
设
由(1)知。
对 ,对第一步用全概率公式:
若第一步走到 ,又最后一个被访问的是 ,则在到达 之前,节点 必已再次被访问;否则质点不可能"跨过" 去访问另一侧的节点。于是此时"最后一个被访问的是 "这件事,与"从 出发,把其余 个点都看作尚未访问时,最后一个被访问的是 "是同一事件。再把节点重标为
便回到原问题的同一形式,所以
同理,
故
这说明 成等差数列。
再由关于节点 的对称性,得 。而等差数列首末项相等,只能是常数列,故
结合 ,即得
习题2.6
这里反复用到尾部控制:先把概率界化为期望界,再用求和或积分收束。
设 是概率母函数,。证明 和 也是概率母函数。问
是否依然是概率母函数?
证明
设
则
各项系数非负,且
故 是概率母函数。
又
其系数也都非负,且和为
故 也是概率母函数。
再设
当 时,
其系数非负,且
故它仍是概率母函数。特别地,当 时总成立;若 ,则只有在 时该式才有意义,此时它恒等于 ,也仍是概率母函数。
设 服从参数为 的几何分布,即
又设非负整值随机变量 的概率母函数为 ,且 与 独立。证明
证明
由全概率公式和独立性,
而
故
证明
是 个两两独立、三三独立但不相互独立的随机变量的联合母函数。
证明
由
可见各项系数都非负,且系数和为 ,故它确是某个四维随机向量的联合母函数。
对边缘母函数,有
其余三个也一样。
再看二维联合母函数,
由对称性,任意两个随机变量都独立。
再看三维联合母函数,
由对称性,任意三个随机变量也都独立。
但若四个随机变量相互独立,则其联合母函数应为
这显然不等于 ,例如右边含有 项而左边没有,故它们不相互独立。
补充内容
分布函数刻画偏解析性质,随机游走偏递推和停时直觉;两部分可以分开读。
课程拾遗
设 是一个函数,则 是某个随机变量的分布函数,当且仅当它满足以下三个性质:
-
单调不减性:对于任意 ,有 ;
-
右连续性:对于任意 ,有 ;
-
规范性:,且 。
证明
必要性略。下面证明充分性。
设 满足以上三条性质。取一个服从 的随机变量 ,定义
由 与 可知,上面的集合非空且有下界,因此 的定义是有意义的。
对任意 ,若 ,则 ,从而 。故
反过来,若 ,则对每个 都可取某个 使得 。由 单调不减,
令 ,再用 的右连续性,就得 。因此
于是
从而
所以 正是随机变量 的分布函数。
好题共赏
设 是状态空间 上的简单随机游走,且 与 都是吸收态。若 ,求在第 步恰好被吸收的概率。
证明
记吸收时刻为
对 ,记
则
并满足边界条件
以及初值
由于边界为零,对空间变量作正弦展开
代入递推式得
故
再由初值可得
于是
从而
所以
这就把题目化成了上面的显式表达式。
若从任意初始位置 出发,只需把初值改成
其余推导完全相同。
设独立重复掷一枚硬币,每次出现正面的概率为 ,反面的概率为 。记 为首次连续 次出现正面所需的抛掷次数,求 的生成函数。
证明
记
显然
对 ,按前 次中第一次出现反面的位置分类,可得递推
设生成函数
对上式求和得
整理得
于是
再用等比数列求和公式
化简得
这就是 的生成函数。
期中复习
复习可按组合计数、分布计算、条件概率、期望方差、随机游走来整理。答案和使用条件都值得核一遍。
复习建议是:是把书上的概念、作业里的题型,以及反复讲过的方法重新理一遍。大体上可以按"概念 作业 典型难点"这条线来复习。
一、 基本概念
考试里最容易失分的,往往不是最难的计算,而是概念模糊、定义写不清楚、性质不会用。下面这些内容至少要做到"能自己说清楚定义,能判断一道题该用哪个概念":
-
概率空间三要素:样本空间、事件域、概率测度;
-
随机变量与分布函数的定义,以及分布函数的基本性质;
-
离散型与连续型随机变量,分布列、密度函数、分布函数之间的关系;
-
二维随机变量的联合分布、边缘分布、条件分布、独立性;
-
数学期望、方差、协方差、相关系数的定义与基本性质;
-
条件期望的含义,以及"先条件、后取期望"的思想;
-
常见分布的特点:Bernoulli,Binomial,Geometric,Poisson。
这一部分建议大家不要只"看着眼熟",而要真的能脱离讲义自己复述出来。尤其是"什么叫独立""什么叫条件期望""什么叫分布函数",最好都能用一句完整的话说明白。
举两例:
掷两枚均匀硬币,详细写出概率空间三要素,并说明其上存在两个独立的随机变量。
解答
可以取
其中第一个字母表示第一枚硬币的结果,第二个字母表示第二枚硬币的结果。事件域取为
概率测度 由
给出。
这就写出了概率空间三要素 。
再定义两个随机变量
则 都只取 两个值,且
进一步,
所以 与 相互独立。
在 上给出一个概率空间,并问
何时独立?
解答
取
其中 表示 上由区间长度给出的 Borel 概率测度,即对任意闭区间 有
记
则 独立当且仅当
不妨设 。
(1) 若 ,则两区间至多在一个点相交,所以
此时独立当且仅当 ,也就是至少有一个区间退化成一点。
(2) 若 ,则 ,于是
独立要求
所以或者 ,或者 。也就是说,或者 是单点,或者 。
(3) 若 ,则是部分重叠但互不包含。记
则 ,并且
若独立,则应有
矛盾。因此这种情形不可能独立。
综上,在这个概率空间上,两个闭区间独立当且仅当至少有一个区间的概率是 或 ;也就是说,至少有一个区间要么退化成单点,要么就是整个 。
二、 作业回顾
作业题本身就是最重要的复习资料。很多考点会以相似(甚至相同)形式反复出现,所以必须所有的作业题都会做。
其中建议重点回看的例子包括:
- 若 独立,且 ,,求
- 若 ,在给定 的条件下抛 次硬币,设得到的正面数为 ,求
- 设直线上简单随机游走
其中
对 ,求
需要掌握的方法和技术有:
-
Cauchy 不等式,以及它在估计、证方差非负、控制期望量级中的基本用法;
-
Markov 不等式,以及由"期望控制尾概率"这一思路出发的简单估计;
-
全期望公式("匿名统计学家公式");
-
随机变量拆成示性 r.v. 之和,方便期望、方差甚至高阶矩计算。
三、 典例分析
1. 母函数与矩母函数
母函数/矩母函数的作用:
-
普通母函数可以把非负整值随机变量的分布列编码成一个函数,从整体上用分析手段处理分布;
-
通过求导可以计算期望、方差以及更高阶矩;
-
对独立随机变量,和的母函数/矩母函数等于各自母函数/矩母函数之积,因此便于求和的分布;
-
母函数特别适合处理递推关系、首次出现时间等问题;
-
矩母函数在存在时常可用来刻画分布,并方便比较不同分布的矩。
设 为直线上的对称随机游走,,每一步以概率 向右走一步,以概率 向左走一步。求
解答
记
则所求概率为
因为每条长度为 的轨道出现的概率都等于 。
设这条轨道第一次回到原点的时刻是 ,其中 。那么在时刻 必有 。把这一段轨道整体下移 ,便得到一条从 出发、长为 、始终不低于 、并在末时刻回到 的轨道,因此这样的前段共有 条。第一次回到原点以后,后面的 步又是一条同类轨道,共有 条。所以
引入母函数
由上式得
因此
解得
这里取使 的那一支。于是
因此
设非常值随机变量 取值于 ,其母函数 为 次多项式,且满足 Lee--Yang 性质:复变量 的方程 的所有根均在单位圆上。
-
写出一个随机变量,其母函数具有 Lee--Yang 性质。
-
证明对所有非负整数 ,
- 令
证明
解答
(i) 一个典型例子是二项分布
此时
它的全部零点都是 ,位于单位圆上,因此满足 Lee--Yang 性质。
(ii) 设
由于 的系数都是实数,且所有根都在单位圆上,因此这些根成共轭对出现,从而可写成
于是
右端是 的偶函数,所以 是偶函数。因而对一切非负整数 ,
也就是
(iii) 由上问取 可知
因此 。
记
由于奇数阶矩都为零,
从而
另一方面,令 ,则
故
因此
其中 为常数。又因为 ,所以
若改写成四阶导数,则
因此 的 系数为负,故
即
标准化后得到
另一方面,由 Jensen 不等式(或 Cauchy 不等式)
综上,
2. 简单随机游走及其常见变式
请优先掌握讲义内的所有内容,可阅读前面作业讲解的部分,那几题都需要重点掌握。一定要掌握课本定理2.5.2到定理2.5.5,考试时反射原理、投票定理都可以直接引用。
在只有两位候选人的选举中,每张选票只投给其中一人且不能弃票。已知最终计票结果为 有 张选票, 有 张选票,其中 。若按随机顺序计票,求计票过程中 至多落后 一票的概率。
解答
仿照前面的做法,构造随机游走,令
则前 张票计完后, 比 多出的票数就是 。题目要求的是
现在在每一种计票次序最前面补上一张投给 的选票。这样便得到一个新的计票次序:其中 有 张票, 有 张票,而且新序列的每一步满足
也就是说,原问题恰好化为:在新的选举中, 在计票过程中从不落后于 。
反过来,任何一个" 从不落后于 "的新计票次序,第一票必为 ;删去这一票后,就恢复为原问题中的一个合法次序。因此这是一个一一对应。
于是由投票定理(或上面习题2.5.2(2)的结论),合法次序数为
而原问题的总计票次序数为
故所求概率为
即
3. 概率论与其他学科的交叉
概率论与线性代数的结合可能催生有趣的数学问题与方法,且看一例。令为 矩阵, 个矩阵元 为相互独立且同分布的对称伯努利随机变量,即
定义, 试回答 (i) 计算 ;(ii) 猜测 的一般公式并证明之。
解答
关键观察是:一个整数是奇数,当且仅当它模 余 。因此
也就是说,把 看成 上的矩阵时,问题就变成了:
现在从"行向量是否线性无关"来计算这个概率。把 的各行记为
由于各个矩阵元独立且都以概率 取 ,所以每个 都在 中等概率取值,并且彼此独立。
第一行非零的概率为
若前 行已经线性无关,则它们张成的子空间有 个向量,所以第 行落在这个子空间外的条件概率为
于是
因此
所以一般公式为
记对称群 为从 到 的所有一一映射(共 个),从 中均匀等概率选取一个映射 ,记其不动点数
对换数
-
详细给出有关概率空间。
-
是否独立。
-
计算 的分布列。
-
计算 。
解答
(1) 概率空间可取为
这里样本点就是一个排列 ,而 都是定义在 上的随机变量。
(2) 当 时, 不独立。事实上,
而
因为例如排列 就有一个对换。另一方面,若 ,则 只能是恒等排列,此时必有 。所以
故 不独立。
(3) 对 ,先选出哪 个点是不动点,有
种选法。剩下的 个点必须都不是不动点,因此对应的是一个错排。记 为 个元素的错排数,则
再由容斥原理,
于是
这就是 的分布列。
(4) 对每个 ,定义示性随机变量
则
由期望的线性性,
固定一对 后,使 的排列共有 个,所以
因此
章末回看
- 本章原始题目和解答正文来自对应 TeX 分文件。
- 可先只看题目框,写出关键等式后再展开证明或解答。
- 若结论用到独立性、可列可加性、换元公式或矩条件,最好顺手标明。