2012-07-17 196 views
2

我的目标是分类非语音信号,我在Java中使用mfcc和dtw。但是我陷入了中间。我将不胜感激任何帮助。 我已经评估了每个帧的13个mfcc值,但是有些值是负值,我很困惑我所遵循的过程是对还是错。目前我正在使用JAudio提供的代码。我也尝试过其他代码,他们也给我负面的价值。其次,我得到了每帧13个系数,考虑到一定长度的样本157帧,我得到157套13 mfccs。我很难在DTW中使用所有的系数,因为dtw只给出两个时间信号之间的最近距离。我确实有DTW代码来比较两个时间信号。我不确定如何使用信号的所有mfccs值作为功能。声音分类使用mfcc和动态时间规整(dtw)

我缺少一些关键的分类步骤吗?请帮帮我。

回答

0

假设你有N1组13个MFCC,第一组信号和第二组MFCC组。 您应该计算每个之间的距离从第一信号设置每个设置从第二(可以使用Euclidian Distance的距离的两个13级阵列之间)

这将留下一个您现在应该在其上应用DTW的N1xN2二维数组。

+0

你能解释什么是_13大小的阵列_和_N1xN2二维阵列_?另外它也会让您置意于您的意思。目前,您似乎建议在N1xN2矩阵上应用DTW。如果是这样的话,那对我来说根本没有意义。您将得到一个对应于两个矩阵的最优翘曲的向量,而DTW将针对表示类似信号的两个向量进行计算。就DTW而言,这些向量构成一个矩阵。更重要的是,我仍然不明白这13个系数在哪里。 – Celdor 2015-11-03 13:18:24