重读《数字信号处理》,主要想对下册统计数字信号部分进行梳理。因为人发出的语音信号在每次观察下都是随机的,但是有别与一般的随机变量,它加入了时间这个维度。故针对一个随机信号有两个随机因素,时间t和样本观察n。先好好的分析一波随机变量,再加入时间推广到随机信号。
随机变量
随机变量X:描述自然件随机事件
- 连续值:服从如正态分布等
- 离散值:服从如二项分布、泊松分布
表达以上分布的方式:分布函数/概率密度/数字特征
均值、均方值、方差、矩
这几个概念讲解的顺序为:
- 均值
- 均方值、方差
- 矩
⭕️均值:
μX=E{X}=∫−∞∞xp(x)dx
⭕️均方值、方差:
DX2=E{∣X∣z}=∫−∞∞∣x∣2p(x)dxσX2=E{∣X−μX∣2}=∫−∞∞∣x−μX∣2p(x)dx
这里可以发现,这两个概念都可以用E{⋅}均值去解释。均方值是对所有样本【所有随机事件】的平方求均值,方差是对离中心点的平方求均值。
⭕️引出高阶矩的概念:
定义原点矩:
ηXn=E{∣X∣m}=∫∞∞∣x∣mp(x)dx
定义中心矩:
γX=E{∣X−μX∣m}=∫−∞∞∣x−μX∣mp(x)dx
可以很轻易的发现均方值和方差是引入矩定义后m=2下的情况。
根据m的大小可以定义,一阶、二阶、三阶、四阶统计量,等
三阶统计量:斜度
Skew =E{[σXX−μX]3}=σX31γX3
四阶统计量:峰度
Kurtosis =E{[σxX−μx]4}−3=σx41γx4−3
上帝视角与样本的关系
因为之前在机器学习中,对一些概念性的理解产生了点误解,频率派和贝叶斯派的区分中,有涉及到上帝视角。
核心在于:p(x)的求解
- 若来源于样本的且为离散变量,则可以直接用频率来代替概率计算该值【大数定理】
- 若来源于假设,离散如二项式分布,连续如正太分布,其各自拥有各自的分布律函数。则p(x)与样本无关,我称之为上帝视角或者理想真值,因为当假设分布确定时,则p(x)就已经确定了。
多维随机变量
当随机变量X拥有N维特征:
X=[X1,X2,…,XN]T
则均值为:
μX=[μX1,μX2,⋯,μXN]T,μXi=E{Xi}
在这里统一用X代表随机变量,用x代表单个样本
则方差矩阵为:
Σ==E{(X−μX)⋅(X−μX)T}⎣⎢⎢⎢⎡σ12cov(X2,X1)⋮cov(XN,X1)cov(X1,X2)σ22⋮cov(XN,X2)......⋮⋯cov(X1,XN)cov(X2,XN)⋮σN2⎦⎥⎥⎥⎤
不同维度之间的计算用协方差定义的,这里的cov(Xi,Xj)最终得到的是实数。
协方差,不仅不同维度之间可以计算,也可扩展成两个多维随机变量之间的定义,此时结果就不再是实数了,而是协方差矩阵。cov(X,Y)=E{(X−μX)(Y−μY)T}
随机信号
这里温漂电压是一个随机信号。在相同的条件下独立地进行多次观察。
随机信号x(n,i)有以下四种情况:
-
若n固定(时间固定),i变动,则为随机变量
-
若i固定(单样本),n变动,则为一个一维离散时间序列
-
若i和n都变动,则x(n,i)是一个随机信号。
-
若i和n都固定,则x(n,i)是一个实数。
对随机变量,即样本i变动,可做如下统计变量【集总平均】:
-
均值
μX(n)=E{X(n)}=N→∞limN1i=1∑Nx(n,i)
-
方差
σx2(n)=E{∣X(n)−μX(n)∣2}=N→∞limN1i=1∑N∣x(n,i)−μX(n)∣2
-
均方
DX2(n)=E{∣X(n)∣2}=N→∞limN1i=1∑N∣x(n,i)∣2
-
自相关函数
rX(n1,n2)=E{X∗(n1)X(n2)}=N→∞limN1i=1∑Nx∗(n1,i)x(n2,i)
-
自协方差函数
covX(n1,n2)=E{[X(n1)−μX(n1)]⋅[X(n2)−μX(n2)]}=N→∞limN1i=1∑N[x(n1,i)−μX(n1)]⋅[x(n2,i)−μX(n2)]
注:以上所有的统计后的量都是关于n的变量
平稳随机信号描述
宽平稳(wide-sense stationary,WSS)信号,又称广义平稳信号的定义:
-
均值为常数
μX(n)=E{X(n)}=μX
-
方差也为常数
σX2(n)=E{∣X(n)−μX∣2}=σX2
-
自相关函数仅与选取点有关
rX(n1,n2)=E{X∗(n)X(n+m)}=rX(n2−n1)
再看随机信号图:
例12.2.1 随机相位正弦序列
X(n)=Asin(2πfnTs+Φ)
式中A,f均为常数,Φ是一随机变量,在0∼2π内服从均匀分布,即根据不同的Φ1,Φ2,…,Φk生成不同的x1(n),x2(n),…,xk(n)信号,其中每一个x1(n)是一串离散时间序列。
p(φ)={2π100⩽φ⩽2πother
解答:
rX(n1,n2)=E{A2sin(2πfn1Ts+Φ)sin(2πfn2Ts+Φ)}=2πA2∫02πsin(2πfn1T,+φ)sin(2πfn2Ts+φ)dφ=2A2cos[2πf(n2−n1)Ts]
所以随机相位正弦波是宽平稳的。
平稳随机信号的各态遍历性
上面已经介绍了随机信号X(n)的均值、方差、均方及自相关函数等,均是建立在随机变量xi(n)集总平均的意义上的,如求解自相关函数:
rx(m)=E{X(n)X(n+m)}=N→∞limN1i=1∑Nx(n,i)x(n+m,i)
但是要精确地求出上值,需要无穷多个样本,这在实际工作中是不可能的。
上图中,若我们要精确地求出红点的值,就要沿样本方向求均值,但是这做不到。但是假定单一样本函数随时间的变化的过程可以包含该信号所有样本函数的取值经历。这句话的含义是沿着时间t,每个时间节点t都可以看做独立测试的一个样本i(集总平均=时间平均)。故上述的自相关函数可以改写为:
rX(m)=M→∞lim2M+11n=−M∑Mx(n)x(n+m)
判断例12.2.1 中的正弦序列信号是否为平稳随机信号
-
集总平均:
μX(n)=rX(n1,n2)=02A2cos(2πfmTs)
-
时间平均
μx=rx(m)==M→∞lim2M+11n=−M∑MAsin(2πfnTs+φ)=0=μXM→∞lim2M+11n=−M∑MA2sin(2πfnTs+φ)sin[2πf(n+m)Ts+φ]2A2cos(2πfmTs)
可以发现时间平均=集总平均,是平稳随机信号。
平稳随机信号的功率谱
根据Wiener-Khintchine
定理,自相关函数和平稳随机信号的功率谱互为傅里叶变换:
PX(eiω)PXY(eiω)=m=−∞∑∞rX(m)e−jωm=m=−∞∑∞rXY(m)e−jωm
- 自相关函数的计算
rX(m)=2π1∫−ππPX(ejωm)ejωmdω
其中m=0时,反映了信号的平均功率rX(0)=2π1∫−ππPX(ejωm)dω=E{∣X(n)∣2}
例题:平稳信号X(n)的自相关函数rX(m)=a∣m∣,∣a∣<1,求其功率谱。
PX(eiω)==m=−∞∑∞a∣m∣e−iωm=m=0∑∞ame−jωm+m=−∞∑0a−me−iωm−11−ae−iω1+1−aeiω1−1=1+a2−2acosω1−a2,∣a∣<1
实际功率谱
实际工程中所遇到的功率谱可分为三种:
- 平的谱:白噪声谱
- 线谱:正弦信号所组成的功率谱
- ARMA谱:既有峰点又有谷点