2015-10-16 241 views
3

我有一个时间序列数据设定为csv文件与以下columns-如何适应数据到隐马尔可夫模型sklearn/hmmlearn

ID,TIMESTAMP,MEASUREMENTS[10] 

对于ID多个测量是否有与所述相关联的时间戳时这些测量做了。列测量值包含10个测量值的列表。一个记录中的测量(与特定时间戳相关)在某种程度上取决于之前的记录。

例如。的数据集:

ID,TIMESTAMP,MEASUREMENTS 
1,0,[123,456,567.....] 
1,100,[....] 
1,350,[....] 
2,0,[....] 
2,200,[.....] 

此外,测量数组在某些索引处包含NaN。 最后,我有一些与每个ID相关的标签,这是直到该ID的最后时间戳执行的测量的结果。 我的目标是将这些数据放入一个HMM模型中,然后预测具有相同格式的测试数据集的标签。 如何将此模型放入HMM模型sklearn/hmmlearn? sklearns文件不符合模型的标记,没有参数解释。

+0

你解决了这个问题吗?我认为我们有类似的问题 –

回答

2

由于您的问题需要预测下SQUENCE的标签。您应该使用seqlearn这是一个序列分类工具。

而且,在HMM拟合数据将需要一些预处理因为它接受阵列的列表。您可以按时间升序连接时间戳和与每个ID相关的三个测量值。这会为每个ID提供一个长度为33的序列。

让我知道你是否需要进一步的帮助。我最近将HMMLearn用于一个项目。

相关问题