音频正常化/固定？

-1

我正在使用一些音频指纹识别技术来标记长时间录音中的歌曲。例如，在电台节目中。指纹识别机制工作正常，但我有正常化（或降采样）的问题。音频正常化/固定？

在这里你可以看到两个相同的歌曲，但不同的波形。我知道我应该做一些直流偏移固定，并使用一些高和低增益滤波器。我已经用Sox使用高通1015和低通1015做了他们。我使用wavegain来修复音量和直流偏移。但在这种情况下，波形变成一个象下面这样：

但即使在这种情况下，我不能得到相同的指纹。（我不期望％100相同，但至少％50会很好）

所以。你怎么看？我能做些什么来修复记录以获得相同的指纹？也许一些音频过滤将工作，但我不知道哪一个使用？你可以帮我吗？

顺便说一句，这里是指纹技术的解释。

这是一个真正的编程问题吗？ – Amber 2009-08-05 06:36:19

你的输入波形可能在削波，因此没有过滤的量将会导致有意义的“指纹”。确保您收集有合理动态范围但不剪辑的有效输入样本。

2010-01-31 20:01:47

回答