最近我开始在我的iPhone上使用Shazam app。对于那些不知道的人来说,这款应用通过聆听歌曲中的一小段歌曲来识别歌曲。我很惊讶它的准确性和速度,所以我决定做一点挖掘。什么是从音频文件中提取数据的一些好的库?
我发现他们的开发者之一here写的一篇论文。在这篇论文中,开发人员详细描述了Shazam中使用的指纹算法。
作为一个宠物项目编号喜欢做自己的歌曲指纹应用程序,所以我可以得到一些音频编程的经验。
什么是一些音频库,可以帮助您提取音频片段或mp3歌曲的频率,幅度和其他特征,例如音频片段或音乐的持续时间?
我使用.NET,但我打开其他语言库。我对开源和付费图书馆也很好。只要我可以可靠地提取音频特征,我会很高兴。
参见:
How Shazam Works
Shazam Journal Paper
神奇的文章,谢谢你。我一直想知道Shazam如何工作,现在我知道了。我在C#中做了很多音频编程,包括FFT和其他DSP,我很乐意帮助你。您可以通过我的个人资料中的网站与我联系。 – MusiGenesis 2009-08-16 00:44:52