2016-08-15 152 views
5

假设我想预测一个人是class1=healthy还是class2= fever。我有一个具有以下域的数据集:{normal,cold,dizzy}了解如何构建高阶马尔可夫链

转换矩阵将包含从我们的训练数据集中生成的转换概率,而初始向量将包含人从一个状态开始的概率(day1)域{normal,cold,dizzy},这也是从我们的训练集中生成的。

如果我想建立一阶马尔科夫链,我会产生3×3的转换矩阵和每类像这样一个1×3初始向量:

> TransitionMatrix 
     normal cold dizzy 
normal  NA NA NA 
cold  NA NA NA 
dizzy  NA NA NA 

>Initial Vector 
    normal cold dizzy 
[1,]  NA NA NA 

的NA将充满相应概率。

1-我的问题是关于高阶链中的转移矩阵。例如,在二阶MC我们将有大小domain²xdomain²的像这样的过渡矩阵:

   normal->normal normal->cold normal->dizzy cold->normal cold->cold cold->dizzy dizzy->normal dizzy->cold dizzy->dizzy 
normal->normal    NA   NA   NA   NA   NA   NA   NA   NA   NA 
normal->cold    NA   NA   NA   NA   NA   NA   NA   NA   NA 
normal->dizzy    NA   NA   NA   NA   NA   NA   NA   NA   NA 
cold->normal    NA   NA   NA   NA   NA   NA   NA   NA   NA 
cold->cold     NA   NA   NA   NA   NA   NA   NA   NA   NA 
cold->dizzy    NA   NA   NA   NA   NA   NA   NA   NA   NA 
dizzy->normal    NA   NA   NA   NA   NA   NA   NA   NA   NA 
dizzy->cold    NA   NA   NA   NA   NA   NA   NA   NA   NA 
dizzy->dizzy    NA   NA   NA   NA   NA   NA   NA   NA   NA 

这里小区(1,1)代表如下序列:normal->normal->normal->normal

或它将代替只是domain²xdomain像这样:

   normal cold dizzy 
normal->normal  NA NA NA 
normal->cold  NA NA NA 
normal->dizzy  NA NA NA 
cold->normal  NA NA NA 
cold->cold   NA NA NA 
cold->dizzy  NA NA NA 
dizzy->normal  NA NA NA 
dizzy->cold  NA NA NA 
dizzy->dizzy  NA NA NA 

这里小区(1,1)表示normal->normal->normal其是从之前的表示不同

2-2是什么,我们需要有关程度的MC的初始向量大小1xdomain的,像这样两个初始向量:

 normal cold dizzy 
[1,]  NA NA NA 

导致每班两个初始向量。第一个给出healthy/fever类的第一天发生{normal,cold,dizzy}的概率,而第二个给出healthy/fever第二天发生的概率。这会给出4个初始向量。

或想我们只需要大小1xdomain²的一个初始向量像这样:

normal->normal normal->cold normal->dizzy cold->normal cold->cold cold->dizzy dizzy->normal dizzy->cold dizzy->dizzy 
[1,]    NA   NA   NA   NA   NA   NA   NA   NA   NA 

我可以看到代表初始向量是在案件问题的第二种方式如何,我们希望只观察分类一个国家。

回答

2

假设这组空格是S。典型地,在Ñ阶,

  1. 过渡矩阵具有维度| S | n X | S |。这是因为鉴于目前的状态历史,我们需要单个下一个状态的概率。确实,这个单一的下一个状态引起另一个复合状态的历史n,但转换本身是单一的下一个状态。见this example in Wikipedia,例如..

  2. 初始分布是分布在| S | n元素(您的第二个选项)。

+0

对于第二个假设我有一个观察只有一个状态说'正常'。我将如何从初始分配中检索?我应该总结所有这些'正常 - >正常正常 - >冷常态 - >头晕'(不知道我是否足够清楚这个问题) – Imlerith

+0

@Imlerith如果IIUC你的问题,它是如何计算边际分布从联合分销。这是[众所周知](http://stats.stackexchange.com/questions/54472/given-a-table-defining-the-joint-probabilities-how-do-i-calculate-certain-param)。 –

+0

我目前正在学习更高级的马尔可夫链,你有什么好的文献来推荐?我很难找到它。我主要在网上找到powerpoints,但没有任何参考。我感兴趣的是如何转换矩阵将是一个吸收高阶马尔可夫链。意味着一旦链条进入链条,一个或多个状态就不可能离开。 谢谢:) – TKN