2012-07-23 107 views
2

维基百科说你不知道第一个状态是什么,所以你必须在先前的状态向量中分配每个状态的概率。但是你确实知道转移概率矩阵是什么,并且该矩阵的特征值为1的特征向量是HMM中每个状态的频率(我认为),那么为什么不用这个向量来处理先验概率状态向量呢?为什么前向 - 后向算法中的先验状态向量不是特征值为1的转移矩阵的特征向量?

+0

通常在迭代算法中,初始起始位置并不重要,因为它最终会收敛。无论如何,你应该添加一个链接到你提到的维基百科文章,否则这个问题会变得模糊。 – hugomg 2012-07-23 21:16:06

回答

2

这实际上是一个建模决定。你的建议当然是可能的,因为它几乎相当于在大量的观察结果前面添加了一个观察点,其中根本没有观察到隐藏状态或者没有影响 - 这会给出任何原始状态的时间来平衡到平衡点分配。

但是,如果您有一段具有分隔开头的观察值,例如说话者开始时的一段语音或从句首开始的一段文字,则没有特别的理由相信第一个状态的分布与均衡分布是一样的:我非常怀疑'e'是否是句子开头最常见的字符,而众所周知,它是英语中最常见的字符文本。

除非你有很多非常短的观测序列,否则你选择的并不重要。大多数情况下,如果您想将状态概率中的一个置为零,我只会担心,因为经常用于优化HMM参数的EM算法或Baum-Welch算法可能不愿重新估计远离零的参数。