我正在使用一些音频指纹识别技术来标记长时间录音中的歌曲。例如,在电台节目中。指纹识别机制工作正常,但我有正常化(或降采样)的问题。音频正常化/固定?
alt text http://i26.tinypic.com/2v0j1c3.jpg
在这里你可以看到两个相同的歌曲,但不同的波形。我知道我应该做一些直流偏移固定,并使用一些高和低增益滤波器。我已经用Sox使用高通1015和低通1015做了他们。我使用wavegain来修复音量和直流偏移。但在这种情况下,波形变成一个象下面这样:
alt text http://i27.tinypic.com/dpk9dy.jpg
但即使在这种情况下,我不能得到相同的指纹。 (我不期望%100相同,但至少%50会很好)
所以。你怎么看?我能做些什么来修复记录以获得相同的指纹?也许一些音频过滤将工作,但我不知道哪一个使用?你可以帮我吗?
顺便说一句,这里是指纹技术的解释。
http://wiki.musicbrainz.org/Future_Proof_Fingerprint
http://wiki.musicbrainz.org/Future_Proof_Fingerprint_Function
这是一个真正的编程问题吗? – Amber 2009-08-05 06:36:19