为什么前向 - 后向算法中的先验状态向量不是特征值为1的转移矩阵的特征向量？

维基百科说你不知道第一个状态是什么，所以你必须在先前的状态向量中分配每个状态的概率。但是你确实知道转移概率矩阵是什么，并且该矩阵的特征值为1的特征向量是HMM中每个状态的频率（我认为），那么为什么不用这个向量来处理先验概率状态向量呢？为什么前向 - 后向算法中的先验状态向量不是特征值为1的转移矩阵的特征向量？

来源

2012-07-23 buckwheats

通常在迭代算法中，初始起始位置并不重要，因为它最终会收敛。无论如何，你应该添加一个链接到你提到的维基百科文章，否则这个问题会变得模糊。 – hugomg 2012-07-23 21:16:06

这实际上是一个建模决定。你的建议当然是可能的，因为它几乎相当于在大量的观察结果前面添加了一个观察点，其中根本没有观察到隐藏状态或者没有影响 - 这会给出任何原始状态的时间来平衡到平衡点分配。

但是，如果您有一段具有分隔开头的观察值，例如说话者开始时的一段语音或从句首开始的一段文字，则没有特别的理由相信第一个状态的分布与均衡分布是一样的：我非常怀疑'e'是否是句子开头最常见的字符，而众所周知，它是英语中最常见的字符文本。

除非你有很多非常短的观测序列，否则你选择的并不重要。大多数情况下，如果您想将状态概率中的一个置为零，我只会担心，因为经常用于优化HMM参数的EM算法或Baum-Welch算法可能不愿重新估计远离零的参数。

来源

2012-07-24 04:53:37 mcdowella

为什么前向 - 后向算法中的先验状态向量不是特征值为1的转移矩阵的特征向量？

回答

相关问题