2013-01-04 50 views
1

我在C#中开发了一个应用程序,它尝试使用Skype ActiveX和Microsoft的语音识别引擎识别pc-to-land电话呼叫中的短语,并通过tcp/ip端口重定向呼叫。C#和Skype语音识别

在手机中,机器播放录音,所以语音非常清晰。但System.SpeechMicrosoft.Speech都不能识别任何有用的东西。

它已将语法加载到期望的选项,但没有任何内容。如果我说话,我必须说一个字,等到它识别出这个单词,然后说出下一个单词,这样才能起作用。

问题是,我该如何改进?或者你知道一个可以在现场对话中做得更好的ASR?

+0

语音识别几乎不可能解决。苹果Siri似乎是迄今为止唯一一家在最好的情况下完成了可以接受的工作的人。 – MrFox

+0

是的,我知道,我在失败的研究中失去了很多时间。现在我在思考,由于我所记录的是,我可能会将音频流与我想要捕捉的原始录音的部分进行比较。我会尽量做一个aproximation,但任何建议将受到高度的欢迎。 – Gabriel

+0

建议将是:停止浪费你的时间,并做一些事情,你可能会得到一些结果。除非你非常聪明,有很多时间,并且确切地知道你在做什么,在这种情况下你不会在这里问。 – MrFox

回答

2

最直接的方法是使用专门为该任务设计的工具,而不是使用手工制作的skype/activex解决方案。

有一些特殊的软件可以将电话连接到可操作的地方。他们中的一些:

Asterisk

Freeswitch

所有这些系统提供语音识别和交互式语音应答功能,通过MRCP协议。设置最简单的方法识别是使用CMUSphinx toolkit

你可以阅读更多关于CMUSphinx融入IVR系统herehere

如果你希望很快开始,有清凉SAAS解决方案,帮助您建立一个点击几下电话应用程序。例如Voxeo

+0

完美!我会看看这些服务。谢谢。 – Gabriel