=σX=E((X−μx)2)协方差: 用于衡量随机变量 X 与 Y 的相关性:
Cov(X,Y)=E[(X−μX)(Y−μY)]
相关系数: 剔除了两个变量量纲影响、标准化后的协方差:
ρ=σXσYCov(X,Y)
多维随机变量
联合概率分布, 联合概率密度:
F(x,y)=P(X≤x,Y≤y)=∫−∞y∫−∞xf(u,v)dudv
边缘分布函数, 边缘概率密度:
FX(x)=F(x,+∞),FY(y)=F(+∞,y),fX(x)=∫−∞+∞f(x,y)dy,fY(y)=∫−∞+∞f(x,y)dx
条件概率密度, 在Y=y的条件下:
fX∣Y(x,y)=fY(y)f(x,y)
Z=X+Y的概率分布:
FZ(z)=P(Z≤z)=∬x+y≤zf(x,y)dxdy=∫−∞+∞f(z−y,y)dy=∫−∞+∞f(x,z−x)dx
如果X和Y独立, 卷积公式:
=∫−∞+∞fX(x)fY(z−x)dx
参数估计
样本:X1,X2,...,Xn,n为样本大小/样本容量/样本量
统计量: 完全由样本决定的量
参数估计问题: 根据样本估计概率函数
- 设有了从总体中抽出的独立随机样本X1,...,Xn, 要依据这些样本去对参数θ1,...,θk 的未知值作出估计. 当然, 我们也可以只要求估计其中的一部分, 或估计它们的某个已知函数g(θ1,...,θk)
矩估计: pass
最大似然估计:
设总体有分布 $f(X, \theta_1, …,\theta_k),X1,...,Xn 为自这总体中抽出的样本, 则样本(X1,...,Xn)的分布(即其概率密度函数或概率函数)为
L(X1,...,Xn,θ1,...,θk)=f(X1,θ1,...,θk)f(X2,θ1,...,θk)...f(Xn,θ1,...,θk)
似然函数: 将上式视为θ的函数, 称为似然函数
最大似然估计: 对于已知的样本, 估计最优的θ值,使得似然函数最大化,即为最大似然估计
0%