估计理论
维库,知识与思想的自由文库
|
估计理论是统计学和信号处理中的一个分支,主要是通过测量或经验数据来估计概率分布参数的数值。这些参数描述了实质情况或实际对象,它们能够回答估计函数提出的问题。例如,估计投票人总体中,给特定候选人投票的人的比例。这个比例是一个不可观测的参数,因为投票人总体很大;估计值建立在投票者的一个小的随机采样上。 又如,雷达的目的是物体(飞机、船等)的定位。这种定位是通过分析收到的回声(回波)来实现的,定位提出的问题是“飞机在哪里?”为了回答这个问题,必须估计飞机到雷达之间的距离。如果雷达的绝对位置是已知的,那么飞机的绝对位置也是可以确定的。 在估计理论中,通常假定信息隐藏在包含噪声的信号中.噪声增加了不确定性.如果没有不确定性,那么也就没有必要估计了.
[编辑] 使用估计理论的领域有非常多的领域使用参数估计理论。这些领域包括(当然不局限于以下列出的领域): 测量参数包含噪声或者其他不确定性。通过统计概率,可以求得最优化的解,用来从数据中提取尽可能多的信息。 [编辑] 估计过程估计理论的全部目的都是获取一个估计函数,最好是一个可以实现的估计函数。估计函数输入测量数据,输出相应参数的估计。 我们通常希望估计函数能最优,一个最优的估计意味着所有的信息都被提取出来了;如果还有还有信息没有提取出来,那就意味着它不是最优的。 一般来说,求估计函数需要三步:
当实现一个估计器之后,实际的数据有可能证明推导出估计器的模型是不正确的,这样的话就需要重复上面的过程重新寻找估计器。不能实现的估计器需要抛弃,然后开始一个新的过程。总的来说,估计器根据实际测量的数据预测物理模型的参数。 [编辑] 基础为了建立一个模型,需要知道几项统计“因素”。为了保证预测在数学上是可以追踪的而不是仅仅基于“内心感受”来说这是必需的。 第一个是从大小为 N 的随机矢量中取出的统计采样,将它们放到一个矢量中,
第二,有相应的 M 参数
它需要根据概率密度函数(pdf)或者概率聚集函数(:en:probability mass function)(pmf)建立
参数本身还可能有一个概率分布(Bayesian statistics),需要定义epistemic probability
模型形成之后的目标就是预测参数,通常表示为 一个普通的估计器是最小均方误差(MMSE)估计器,它利用了参数估计值与实际值之间的误差 作为优化的基础。在最小均方误差估计器中误差进行取平方、最小化。 [编辑] 估计函数(估计子)以下是一些相关的估计函数以及相关的主题
[编辑] 例子: 高斯白噪声中的直流增益让我们来看一个接收到的 N 个独立采样点的离散信号 x[n] , 它由一个直流增益 A 和已知方差为 σ2 (例如, 由于方差已经知道,所以仅有的未知参数就是 A。 于是信号的模型是 两个可能的估计器是:
这两个估计器都有一个平均值 A,这可以通过代如每个估计器的期望得到 和 在这一点上,这两个估计器看起来是一样的。但是,当比较方差部分的时候它们之间的不同就很明显了。 和 看起来采样平均是一个更好的估计器,因为方差部分 [编辑] 最大似然估计使用最大似然估计器继续上面的例子,噪声在一个采样点 w[n] 的概率密度函数(pdf)是 这样 x[n] 的概率变为(x[n] 可以认为是 由于相互独立, 概率密度函数取自然对数 于是最大似然估计器是 对数最大似然函数取一阶 导数 并且将它赋值为0 这就得到最大似然估计器 它是一个简单的采样平均。 从这个例子中,我们发现对于带有固定未知直流增益的AWGN的 N 个采样点来说采样平均就是最大似然估计器。 [编辑] Cramér-Rao 下限为了找到采样平均估计器的Cramér-Rao下限(CRLB),需要找到Fisher information数 从上面得到 取二阶导数 发现负的期望值是无关紧要的(trivial),因为它现在是一个确定的常数
最后,将Fisher information代入 得到 将这个值与前面确定的采样平均的变化比较显示对于所有的 N 和 A 来说采样平均都是等于Cramér-Rao下限。 采样平均除了是最大似然估计器之外还是最小变化无偏估计器(MVUE)。 这个直流增益 + WGN 的例子是 Kay 的 统计信号处理基础中一个例子的再现。 [编辑] 相关书籍
[编辑] 参见 |

.
,
.
.
,其中“hat”表示预测值。
)的![x[n] = A + w[n] \quad n=0, 1, \dots, N-1](/images/math/5/6/6/5663363df48afe184129e2097084c5f1.png)
![\hat{A}_1 = x[0]](/images/math/6/e/9/6e9db6c91eb62f887073054777ce9b4d.png)
它是![\mathrm{E}\left[\hat{A}_1\right] = \mathrm{E}\left[ x[0] \right] = A](/images/math/7/0/b/70bcc4d7877c3ad547bdc8eb1bcdde4c.png)
![\mathrm{E}\left[ \hat{A}_2 \right] = \mathrm{E}\left[ \frac{1}{N} \sum_{n=0}^{N-1} x[n] \right] = \frac{1}{N} \left[ \sum_{n=0}^{N-1} \mathrm{E}\left[ x[n] \right] \right] = \frac{1}{N} \left[ N A \right] = A](/images/math/0/2/a/02a3edea38ce76aa4ebb98a594e081e8.png)
![\mathrm{var} \left( \hat{A}_1 \right) = \mathrm{var} \left( x[0] \right) = \sigma^2](/images/math/a/1/6/a16f112bae27e5c973c13d49bcd1293b.png)
![\mathrm{var} \left( \hat{A}_2 \right) = \mathrm{var} \left( \frac{1}{N} \sum_{n=0}^{N-1} x[n] \right) = \frac{1}{N^2} \left[ \sum_{n=0}^{N-1} \mathrm{var} (x[n]) \right] = \frac{1}{N^2} \left[ N \sigma^2 \right] = \frac{\sigma^2}{N}](/images/math/9/d/1/9d119a504d4632182c925fbe78c435ae.png)
趋向于 0。![p(w[n]) = \frac{1}{\sigma \sqrt{2 \pi}} \exp\left(- \frac{1}{2 \sigma^2} w[n]^2 \right)](/images/math/6/7/0/670561a7c168558c67fc74f6543aff50.png)
)![p(x[n]; A) = \frac{1}{\sigma \sqrt{2 \pi}} \exp\left(- \frac{1}{2 \sigma^2} (x[n] - A)^2 \right)](/images/math/1/b/c/1bc036e6a32781b7f65f6ab5b49e6889.png)
的概率变为![p(\mathbf{x}; A) = \prod_{n=0}^{N-1} p(x[n]; A) = \frac{1}{\left(\sigma \sqrt{2\pi}\right)^N} \exp\left(- \frac{1}{2 \sigma^2} \sum_{n=0}^{N-1}(x[n] - A)^2 \right)](/images/math/e/5/a/e5a2ecbc6240b954f36fbe9c013dd15e.png)
![\ln p(\mathbf{x}; A) = -N \ln \left(\sigma \sqrt{2\pi}\right) - \frac{1}{2 \sigma^2} \sum_{n=0}^{N-1}(x[n] - A)^2](/images/math/c/e/9/ce9bebfb14fb83c728dcb1767e62072a.png)

![\frac{\partial}{\partial A} \ln p(\mathbf{x}; A) = \frac{1}{\sigma^2} \left[ \sum_{n=0}^{N-1}(x[n] - A) \right] = \frac{1}{\sigma^2} \left[ \sum_{n=0}^{N-1}x[n] - N A \right]](/images/math/5/0/2/502e574036bf643a52ccdf30a07fa7ad.png)
![0 = \frac{1}{\sigma^2} \left[ \sum_{n=0}^{N-1}x[n] - N A \right] = \sum_{n=0}^{N-1}x[n] - N A](/images/math/c/a/7/ca7f4480c8b0e6cde32a4e969019cc76.png)
![\hat{A} = \frac{1}{N} \sum_{n=0}^{N-1}x[n]](/images/math/b/4/5/b45f1c26c383896a03622ff94e7ebcc3.png)
![\mathcal{I}(A) = \mathrm{E} \left( \left[ \frac{\partial}{\partial\theta} \ln p(\mathbf{x}; A) \right]^2 \right) = -\mathrm{E} \left[ \frac{\partial^2}{\partial\theta^2} \ln p(\mathbf{x}; A) \right]](/images/math/8/f/d/8fd6d3ff7fea8bc0b0b0eaab0fc1c9d9.png)
![\frac{\partial}{\partial A} \ln p(\mathbf{x}; A) = \frac{1}{\sigma^2} \left[ \sum_{n=0}^{N-1}x[n] - N A \right]](/images/math/b/6/a/b6ace78427766c7f97fcb3c7a4fffeac.png)

![-\mathrm{E} \left[ \frac{\partial^2}{\partial A^2} \ln p(\mathbf{x}; A) \right] = \frac{N}{\sigma^2}](/images/math/0/9/4/0941d64f936f28c67df9637b2526883f.png)



