2012-01-11 59 views
-1

我在Python中编写一些语音识别代码,我希望它能够打开微软语音识别系统,但我希望该系统忽略所有常规的gui界面命令。所以如果我说出一些它认可的东西,它会忽略它并让我的程序处理它。任何熟悉微软语音识别API的人?

回答

1

我相信有一个叫做pyspeech的python API,它是Microsoft语音API的一个包装。请参阅pyspeech (python) - Transcribe mp3 files?以获取可能有用的一些答案。

通常,当人们看到“常规GUI界面命令”时,使用Microsoft语音API,这意味着他们已经实例化了共享识别器。你需要实例化一个inproc识别器。您可以通过在应用程序中实例化SpeechRecognitionEngine()来完成此操作。请参阅SpeechRecognitionEngine Class。我怀疑你正在实例化一个共享识别器 - SpeechRecognizer Class

有一篇关于微软演讲的文章,几年前发表在http://msdn.microsoft.com/en-us/magazine/cc163663.aspx。这可能是迄今为止我发现的最好的介绍性文章。这是有点过时,但非常helfpul。 (该AppendResultKeyValue方法公测后丢弃。)

这两个问题可能对你有一些其他的好信息:

  1. What is the difference between System.Speech.Recognition and Microsoft.Speech.Recognition?
  2. SAPI and Windows 7 Problem