声音分类使用mfcc和动态时间规整（dtw）

我的目标是分类非语音信号，我在Java中使用mfcc和dtw。但是我陷入了中间。我将不胜感激任何帮助。我已经评估了每个帧的13个mfcc值，但是有些值是负值，我很困惑我所遵循的过程是对还是错。目前我正在使用JAudio提供的代码。我也尝试过其他代码，他们也给我负面的价值。其次，我得到了每帧13个系数，考虑到一定长度的样本157帧，我得到157套13 mfccs。我很难在DTW中使用所有的系数，因为dtw只给出两个时间信号之间的最近距离。我确实有DTW代码来比较两个时间信号。我不确定如何使用信号的所有mfccs值作为功能。声音分类使用mfcc和动态时间规整（dtw）

我缺少一些关键的分类步骤吗？请帮帮我。

来源

2012-07-17 raen

假设你有N1组13个MFCC，第一组信号和第二组MFCC组。您应该计算每个之间的距离从第一信号设置每个设置从第二（可以使用Euclidian Distance的距离的两个13级阵列之间）

这将留下一个您现在应该在其上应用DTW的N1xN2二维数组。

来源

2013-03-27 11:58:26 Ioanna

你能解释什么是_13大小的阵列_和_N1xN2二维阵列_？另外它也会让您置意于您的意思。目前，您似乎建议在N1xN2矩阵上应用DTW。如果是这样的话，那对我来说根本没有意义。您将得到一个对应于两个矩阵的最优翘曲的向量，而DTW将针对表示类似信号的两个向量进行计算。就DTW而言，这些向量构成一个矩阵。更重要的是，我仍然不明白这13个系数在哪里。 – Celdor 2015-11-03 13:18:24

结账：http://code.google.com/p/aquila/ 具体来说：http://code.google.com/p/aquila/source/browse/trunk/examples/dtw_distance/main.cpp它有一个示例代码dtw distace计算。

来源

2012-07-26 11:08:41 Sal

声音分类使用mfcc和动态时间规整（dtw）

回答

相关问题