2009-10-25 85 views
0

我想获得一些音频的音色。梅尔频率倒谱系数算法

为了使用我将制作Mel频率倒谱系数算法。

实现看起来很简单(我已经完成了第1步): 1.对信号进行傅立叶变换(窗口化摘录)。 2.使用三角形重叠窗口将上面获得的谱图的能量映射到梅尔尺度上。 3.记录每个mel频率的功率记录。 4.对梅尔日志能量列表进行离散余弦变换,就好像它是一个信号。 5. MFCC是结果频谱的幅度。

在步骤2中我知道如何从频率传递给梅尔规模,但我不知道这是什么三角形的交叠窗口..

如何正确地做到这一步? 三角形重叠窗口是什么意思?

回答

0

一旦你完成了对梅尔尺度的转换,应用一系列重叠的三角形滤波器沿着这个尺度均匀分布(因此对于低频来说间隔更紧密)。也就是说,在这里,您将从FFT返回的大致连续曲线走向一组离散的20-50个离散值。

我搜索了过滤器的图片,并找到了一些(均为pdf格式),herehere(第4页)。这些也在一定程度上描述了他们如何进行计算的其他细节。