音频在线视听数据

我想基于其音频内容，即音频视频数据的不同部分将被分割并归类为沉默的一个项目，我有段工作和分类在线视听资料，音乐内容分析，语音，语音+背景音乐等基于其音频内容。音频在线视听数据

我知道，我必须获得音频部分从视听数据和提取功能，如过零点，谱峰等，并找出段边界，以段音频数据。

但我在开始的时候本身丢失。

我不知道如何与项目开始。该软件的输出是不同的类别，如沉默，语音，音乐等视听下数据的分段

这将是真正有用的，如果有人让我知道

的编程语言，方便用于此目的？
为了开发这个软件，我应该遵循哪些步骤？

我有在数字信号处理没有背景。如果我得到一些指导

来源

2012-02-04 user1188979

我建议寻找到一个多媒体框架，如GStreamer这将是很有益的。它是跨平台的，但最容易从Linux开始。它已经配备了各种插件来接收，解复用和解码音频和视频。它还有几个分析仪（如音频水平和频谱分析仪以及语音活动检测）。这些可能是您实验的一个很好的起点。 Gstreamer本身是用C编写的，但是应用程序可以使用Python，Perl，C＃，C++，Java等语言的绑定...

来源

2012-02-27 08:43:52 ensonic

音频在线视听数据

回答

相关问题