2009-08-05 84 views
-1

我正在使用一些音频指纹识别技术来标记长时间录音中的歌曲。例如,在电台节目中。指纹识别机制工作正常,但我有正常化(或降采样)的问题。音频正常化/固定?

alt text http://i26.tinypic.com/2v0j1c3.jpg

在这里你可以看到两个相同的歌曲,但不同的波形。我知道我应该做一些直流偏移固定,并使用一些高和低增益滤波器。我已经用Sox使用高通1015和低通1015做了他们。我使用wavegain来修复音量和直流偏移。但在这种情况下,波形变成一个象下面这样:

alt text http://i27.tinypic.com/dpk9dy.jpg

但即使在这种情况下,我不能得到相同的指纹。 (我不期望%100相同,但至少%50会很好)

所以。你怎么看?我能做些什么来修复记录以获得相同的指纹?也许一些音频过滤将工作,但我不知道哪一个使用?你可以帮我吗?

顺便说一句,这里是指纹技术的解释。

http://wiki.musicbrainz.org/Future_Proof_Fingerprint

http://wiki.musicbrainz.org/Future_Proof_Fingerprint_Function

+0

这是一个真正的编程问题吗? – Amber 2009-08-05 06:36:19

回答

2

你的输入波形可能在削波,因此没有过滤的量将会导致有意义的“指纹”。确保您收集有合理动态范围但不剪辑的有效输入样本。