基本概念
- 随机试验
- 可以在相同的条件下重复进行,并且每次试验的结果不确定,但试验前可以明确试验的所有可能结果。
- 样本空间
- 随机试验E 的所有可能结果组成的集合,记为S。
- 样本点
- 样本空间中的元素,记为ω。
- 事件
- 样本空间S 的子集称为随机事件,简称事件,通常用大写字母A,B,C,... 表示。
- 基本事件
- 只包含一个样本点的随机事件。
- 必然事件: 包含所有样本点的随机事件。
- 不可能事件: 不包含任何样本点的随机事件。
事件关系和运算
- 包含关系:A⊂B,A 包含于B。
- 相等关系:A=B,A 等于B。
- 和事件:A∪B,A 与B 至少有一个发生。
- 积事件:A∩B,A 与B 同时发生。
- 差事件:A−B,A 发生而B 不发生。
- 互斥事件:A∩B=∅,A 与B 不可能同时发生。
- 逆事件/对立事件:A∪B=S,A 与B 至少有一个发生。
- 频数
- 在n 次试验中,事件A 发生的次数,记为nA。
- 频率
- 事件A 发生的频率,记为fn(A)=nnA。
- 概率
- 事件A 发生的可能性大小,记为P(A),满足以下三个条件:
- 非负性:P(A)≥0。
- 规范性:P(S)=1。
- 可列可加性: 若A1,A2,... 两两互斥,则P(⋃i=1∞Ai)=∑i=1∞P(Ai)。
概率的性质推论:
- P(∅)=0。
- 有限可加性: 若A1,A2,... 两两互斥,则P(⋃i=1nAi)=∑i=1nP(Ai)。
- 包含事件的概率: 若A⊂B,则P(A)≤P(B)。
- P(A)≤1。
- 互补事件的概率:P(Aˉ)=1−P(A)。
- 加法公式:P(A∪B)=P(A)+P(B)−P(A∩B)。
- 古典概型/等可能概型
- 符合以下条件的概率模型称为古典概型:
- 试验的样本空间是有限的。
- 试验的每个基本事件发生的可能性相同。
- 条件概率
- 在事件A 已经发生的条件下,事件B 发生的概率,记为P(B∣A)=P(A)P(AB)。
- 乘法定理, 乘法公式
- P(AB)=P(A)P(B∣A)=P(B)P(A∣B)。
- 划分
- 若一组事件B1,B2,... 满足Bi∩Bj=∅,i=j,且⋃i=1∞Bi=S,则称B1,B2,... 是样本空间S 的一个划分。
- 全概率公式
- 设B1,B2,... 是样本空间S 的一个划分,且P(Bi)>0,i=1,2,...,则对任一事件A,有P(A)=∑i=1∞P(Bi)P(A∣Bi)。
- 贝叶斯公式
- 设B1,B2,... 是样本空间S 的一个划分,且P(Bi)>0,i=1,2,...,则对任一事件A,有P(Bi∣A)=∑j=1∞P(Bj)P(A∣Bj)P(Bi)P(A∣Bi)。
- 先验概率
- 根据以往数据分析得到的概率。
- 后验概率
- 得到新的信息后重新加以修正的概率。
- 独立
- 如果P(AB)=P(A)P(B),则称事件A 与事件B 相互独立,简称A,B 独立。
随机变量
- 随机变量
- 定义在样本空间S 上的实值单值函数X=X(e),其中e∈S。 PS. 将样本空间S 中的每个样本点e 对应到实数轴上的一个点X(e)。单值函数: 对定义域每一个自变量 x,其对应的函数值 f(x)是唯一的。
- 离散型随机变量
- 全部取值范围是有限个或可列无限多个的随机变量。
- (0-1)分布
- 可能结果只有 0 和 1 的分布,记 0 的概率为p,1 的概率为1−p,则P(X=k)=pk(1−p)1−k。
- 伯努利试验
- 可能结果只有A 和Aˉ 的随机试验。将伯努利试验独立重复进行n 次,称为n 重伯努利试验。
- 二项分布
- 重复进行n 次伯努利试验,事件A 发生的次数X 服从二项分布,记为X∼b(n,p)。
- 泊松分布
- 可能取值是 0, 1, 2, …,而取各个值的概率是P(X=k)=k!λke−λ,其中λ>0,的随机变量X 的分布。称X 服从参数为λ 的泊松分布,记为X∼π(λ)。
- 泊松定理
- 设常数λ>0,n>0,npn=λ,有limn→∞Cnkpnk(1−pn)n−k=k!λke−λ。也就是说,当n 很大(≥20),p 很小(≤0.05)时,二项分布近似于泊松分布。可以用泊松分布来计算二项分布的概率。
- 随机变量的分布函数
- F(x)=P(X≤x),x∈R
- 连续性随机变量、概率密度
- 如果对于分布函数F(x),存在非负函数f(x),满足F(x)=∫−∞xf(t)dt,则称X 是连续型随机变量,f(x) 为X 的概率密度(函数)
- 均匀分布
- 在区间(a,b) 上的概率密度函数符合f(x)=b−a1 的分布。记为X∼U(a,b)。
- 指数分布
- 在区间(0,+∞) 上的概率密度函数符合f(x)=λe−λx 的分布。记为X∼E(λ)。
- 指数分布的无记忆性:P(X>s+t∣X>s)=P(X>t)
- 正态分布/高斯分布
- 概率密度函数符合f(x)=2πσ1e−2σ2(x−μ)2 的分布。记为X∼N(μ,σ2)。
- 伽马分布
- 概率密度函数符合f(x)=Γ(α)λαxα−1e−λx 的分布。记为X∼Γ(α,λ)。其中α 为形状参数,λ 为比例参数。
也可以记为X∼Γ(α,β),其中β=λ1。
多维随机变量
- 二维随机变量,联合分布函数
- 由两个随机变量X 和Y 构成的向量(X,Y) 称为随机变量。二元函数F(x,y)=P(X≤x,Y≤y) 称为二维随机变量(X,Y) 的联合分布函数。
- 类似地,二维随机变量也有离散型、连续性、分布律和概率密度函数等概念。
联合概率分布, 联合概率密度:
F(x,y)=P(X≤x,Y≤y)=∫−∞y∫−∞xf(u,v)dudv
边缘分布函数, 边缘概率密度:
FX(x)=F(x,+∞),FY(y)=F(+∞,y),fX(x)=∫−∞+∞f(x,y)dy,fY(y)=∫−∞+∞f(x,y)dx
条件概率密度, 在Y=y的条件下:
fX∣Y(x,y)=fY(y)f(x,y)
Z=X+Y的概率分布:
FZ(z)=P(Z≤z)=∬x+y≤zf(x,y)dxdy=∫−∞+∞f(z−y,y)dy=∫−∞+∞f(x,z−x)dx
如果X和Y独立, 卷积公式:
=∫−∞+∞fX(x)fY(z−x)dx
随机变量的数字特征
数学期望, 简称期望, 又称为均值, 常用μ表示
E(x)=μx=∫−∞∞xf(x)dx
方差, 标准差:
D(X)=Var(X)=E((X−μx)2)=E(X2)−μx2,D(X)=σX=E((X−μx)2)
- 协方差
- 用于衡量随机变量 X 与 Y 的相关性:
Cov(X,Y)=E[(X−μX)(Y−μY)]
- 相关系数
- 剔除了两个变量量纲影响、标准化后的协方差:
ρ=σXσYCov(X,Y)
参数估计
- 样本
- X1,X2,...,Xn,n为样本大小/样本容量/样本量
- 统计量
- 完全由样本决定的量
- 参数估计问题
- 根据样本估计概率函数
- 设有了从总体中抽出的独立随机样本X1,...,Xn, 要依据这些样本去对参数θ1,...,θk 的未知值作出估计. 当然, 我们也可以只要求估计其中的一部分, 或估计它们的某个已知函数g(θ1,...,θk)
- 矩估计
- pass
最大似然估计:
设总体有分布 $f(X, \theta_1, …,\theta_k),X1,...,Xn 为自这总体中抽出的样本, 则样本(X1,...,Xn)的分布(即其概率密度函数或概率函数)为
L(X1,...,Xn,θ1,...,θk)=f(X1,θ1,...,θk)f(X2,θ1,...,θk)...f(Xn,θ1,...,θk)
- 似然函数
- 将上式视为θ的函数, 称为似然函数
- 最大似然估计
- 对于已知的样本, 估计最优的θ值,使得似然函数最大化,即为最大似然估计
随机过程
- 随机过程
- 依赖于参数t∈T 的一族随机变量,记为{X(t),t∈T},其中:T 为参数集。t 通常表示时间。X(t) 表示在时刻t 时过程的状态。X(t) 的所有可能取值的集合称为状态空间。
- 样本函数/样本曲线
- 对随机过程的一次试验,得到的函数x(t),t∈T。
- 伯努利过程/伯努利随机序列
- 与时间无关的随机过程,即X(t)=X。 PS. 例如多次抛硬币的过程。
- 根据任一时刻t 的状态X(t) 是连续型还是离散型,随机过程分为连续型随机过程和离散型随机过程。
- 根据时间参数t 是连续还是离散,随机过程分为连续参数随机过程和离散参数随机过程活随机序列。
- 一维分布函数,一维分布函数族
- 随机变量X(t) 的分布函数,记为FX(x,t)=P(X(t)≤x),称为一维分布函数。FX(x,t) 的全体集合称为一维分布函数族。
- n 维分布函数族
- 对于n 个时刻t1,t2,...,tn,n 个随机变量X(t1),X(t2),...,X(tn) 的分布函数族。
- 均值函数
- 随机变量X(t) 的所有样本函数在时刻t 的平均值,也称集平均或统计平均,记为μX(t)=E[X(t)]。
- 均方值函数
- 随机变量X(t) 的二阶原点矩,记为ΨX2(t)=E[X2(t)]。
- 方差函数
- 随机变量X(t) 的二阶中心矩,记为DX(t)=E[(X(t)−μX(t))2]。
- 标准差函数
- 方差函数的算术平方根,记为σX(t)=DX(t)。
- (自)相关函数
- 两个随机变量X(t1) 和X(t2) 的二阶原点混合矩,记为RX(t1,t2)=E[X(t1)X(t2)]。
- (自)协方差函数
- 两个随机变量X(t1) 和X(t2) 的二阶混合中心矩,记为CX(t1,t2)=Cov[X(t1),X(t2)]=E[(X(t1)−μX(t1))(X(t2)−μX(t2))]。
- 二阶矩过程
- 随机过程X(t) 的二阶矩E[X2(t)] 对于任意时间t 都存在。
- 正态过程
- 对于任意有限个时刻t1,t2,...,tn,n 个随机变量X(t1),X(t2),...,X(tn) 的任意线性组合服从正态分布的随机过程。
- 二维随机过程
- 由两个随机变量X(t) 和Y(t) 构成的随机过程。
- n+m 维(联合)分布函数
- 对于n+m 个时刻t1,t2,...,tn;t1′,t2′,...,tm′,n+m 个随机变量X(t1),X(t2),...,X(tn);Y(t1′),Y(t2′),...,Y(tm′) 的分布函数。
- 独立增量过程
- 随机过程X(t) 的任意两个不相交时间区间上的增量相互独立。
- 增量具有平稳性
- 随机过程X(t) 的任意两个相同长度的时间区间上的增量具有相同的分布。说明增量的统计特性与时间的起点无关,只与时间间隔有关。
- 计数过程
- 表示在连续时间区间[0,t] 内某事件发生的次数的随机过程,记为N(t)。
- 时间间隔(t0,t] 内事件发生的次数记为N(t0,t)=N(t)−N(t0)。
- 时间间隔(t0,t] 内事件发生k 次的概率记为Pk(t0,t)=P{N(t0,t)=k}。
- 泊松过程
- 如果计数过程N(t) 满足以下条件,则称N(t) 为强度为λ 的泊松过程:
- N(0)=0。
- N(t) 是独立增量过程。
- 对于充分小的Δt,事件发生一次的概率P1{N(t,t+Δt)}=λΔt+o(Δt),o(Δt) 是关于Δt 的高阶无穷小。
- 对于充分小的Δt,事件发生j≥2 次的概率Pj{N(t,t+Δt)}=o(Δt)。
泊松过程的性质:
- 增量N(t0,t) 服从参数为λ(t−t0) 的泊松分布,数学表示N(t0,t)∼π(λ(t−t0)),注:泊松分布Pλ(X=k)=k!λke−λ
- 均值函数μN(t)=E[N(t)]=λt
- 方差函数DN(t)=Var[N(t)]=λt
- 协方差函数CN(t1,t2)=Cov[N(t1),N(t2)]=λmin(t1,t2)
- 相关函数RN(t1,t2)=E[N(t1)N(t2)]=λ2t1t2+λmin(t1,t2)
- 泊松流
- 泊松过程中事件发生的时刻。
- 泊松过程等待时间
- 泊松过程中第n 个事件发生的时间,记为Wn=tn,特别地,W0=0。
泊松过程等待时间的性质:
- Wn 的分布函数FWn(t)=P{Wn≤t}=1−P{Wn>t}=1−P{N(t)<n}=P{N(t)≥n}=∑k=n+∞k!(λt)ke−λt。
- Wn 的概率密度函数fWn(t)=dtdFWn(t)=(n−1)!λntn−1e−λt,即Wn∼Γ(n,λ)。
- 注:伽马分布Γ(α,λ):f(x)=Γ(α)λαxα−1e−λx
- 当n=1 时,伽马分布即指数分布。
- 点间间距
- 泊松过程中相邻两个事件的时间间隔,记为Tn=Wn−Wn−1。
- Tn 的概率密度函数fTi(t)=λe−λt,即Ti∼E(λ),即指数分布。
泊松过程的性质:
- 泊松过程的点间间距是独立同分布的指数分布。
- 如果一个过程的点间间距是独立同分布的指数分布,那么这个过程是泊松过程。
- 维纳过程
- 满足以下条件的二阶矩过程W(t) 称为维纳过程:
- W(0)=0。
- W(t1,t2)∼N(0,σ2(t2−t1))。
- 具有独立增量性质。
- 均值函数μW(t)=0。
- 方差函数DW(t)=σ2t。
- 协方差函数CW(t1,t2)=Cov[W(t1),W(t2)]=σ2min(t1,t2)。
马尔可夫链
- 马尔可夫性
- 过程的未来状态只与当前状态有关,与过去状态无关。
- 马尔科夫过程
- 具有马尔可夫性的随机过程。