2012-02-04 42 views
0

我想基于其音频内容,即音频视频数据的不同部分将被分割并归类为沉默的一个项目,我有段工作和分类在线视听资料,音乐内容分析,语音,语音+背景音乐等基于其音频内容。音频在线视听数据

我知道,我必须获得音频部分从视听数据和提取功能,如过零点,谱峰等,并找出段边界,以段音频数据。

但我在开始的时候本身丢失。

我不知道如何与项目开始。该软件的输出是不同的类别,如沉默,语音,音乐等视听下数据的分段

这将是真正有用的,如果有人让我知道

  • 的编程语言,方便用于此目的?
  • 为了开发这个软件,我应该遵循哪些步骤?

我有在数字信号处理没有背景。如果我得到一些指导

回答

0

我建议寻找到一个多媒体框架,如GStreamer这将是很有益的。它是跨平台的,但最容易从Linux开始。它已经配备了各种插件来接收,解复用和解码音频和视频。它还有几个分析仪(如音频水平和频谱分析仪以及语音活动检测)。这些可能是您实验的一个很好的起点。 Gstreamer本身是用C编写的,但是应用程序可以使用Python,Perl,C#,C++,Java等语言的绑定...