2017-07-27 103 views
1

我目前正在开发一个项目,我需要创建一些用户可以与产品交流的功能(Raspberry Pi 3)。在谈话中,我的意思是说用户应该能够向Pi发出一两个字,例如“产品开始”,然后它就会被激活并执行它。连续语音识别

现在正因为如此,当用户说出某个单词组合时,Pi需要能够不断地收听并激活。

我已经实现了SpeechRecognition库,这样的作品,但遗憾的是最多有10秒钟的时间,Pi会收听。

我想知道是否有任何图书馆可以帮助我与我的用例,任何帮助是值得欢迎的。

回答

1

你能更好地解释你是什么意思

可悲的最多到10秒,其中丕会听的。

从我使用CMUSphinx的经验(让我推荐你的用例中的pocketsphinx版本),可以持续工作,没有问题。 你有没有设法知道问题是在Pi侧,还是在SpeechRecognition方面?

你在SpeehRecognition后面使用了什么引擎。 CMUSphinx,谷歌,微软?有了Google和微软,他们有10秒的限制是很正常的。但是,使用CMUSphinx这不应该发生。但是,您可能需要了解如何设置ASR系统。

+0

感谢您的回复。大约10秒钟之后,从执行Python脚本的那一刻起,我的Raspberry Pi将会监听大约10秒。现在这不是Pi本身的问题,这是在SpeechRecognition方面,我发现10秒是它能够识别的最大值。现在你提到了Pocketsphinx,我读了一下它,但我并没有不停地听。你知道它是否能够直接从麦克风识别吗?或者它只能从WAV文件中识别出来。你也有任何好的Pocketsphinx教程吗? –