2011-09-08 75 views
2

如果我们使用语音识别的集成Windows 7功能,我们可以看到,它非常适合猜测我们所指定的内容。它不仅适用于一套有限的命令,而且适用于任何口头的单词。另一方面,当我尝试针对Microsoft.Speech命名空间(Microsoft Speech Server Runtime 10.2是我安装的)中的类进行编程时,我发现自己需要始终定义要使用的有限语法。Microsoft.Speech通用语言语法

有没有一种方法来获取口述音频文件,并尝试将其解析为文本,而无需在Microsoft.Speech中指定自定义语法?

回答

4

我的理解是,桌面操作系统带有听写语法。但是,服务器识别器不包括听写语法,因为它们主要用于电话使用,其中用户向IVR系统提供短命令。对于一些更多的背景下,这个问题可能会有所帮助 - What is the best option for transcribing speech-to-text in a asp.net web app?

记住桌面识别器在同一时间使用一个用户。他们可以接受培训以提高每个用户的认知度。服务器识别器旨在同时处理多个用户。服务器识别器不能被训练。也许,没有训练,准确的听写语法太难了? (或者,也许微软并不希望放弃所有的最好的技术?)

我也看到了(但还没有检查)的桌面识别支持更高质量的音频(更高的比特率和采样大小)和服务器识别器仅限于电话质量音频。也许准确的转录需要更高质量的音频。

+0

你可能是对的。仍然为什么不为服务器识别器制作听写语法,使其更具功能性。 –

+0

引用问题中的一个例子非常好。谢谢。 –