连续语音识别

我目前正在开发一个项目，我需要创建一些用户可以与产品交流的功能（Raspberry Pi 3）。在谈话中，我的意思是说用户应该能够向Pi发出一两个字，例如“产品开始”，然后它就会被激活并执行它。连续语音识别

现在正因为如此，当用户说出某个单词组合时，Pi需要能够不断地收听并激活。

我已经实现了SpeechRecognition库，这样的作品，但遗憾的是最多有10秒钟的时间，Pi会收听。

我想知道是否有任何图书馆可以帮助我与我的用例，任何帮助是值得欢迎的。

来源

2017-07-27 Koen de Haan

你能更好地解释你是什么意思

可悲的最多到10秒，其中丕会听的。

从我使用CMUSphinx的经验（让我推荐你的用例中的pocketsphinx版本），可以持续工作，没有问题。你有没有设法知道问题是在Pi侧，还是在SpeechRecognition方面？

你在SpeehRecognition后面使用了什么引擎。 CMUSphinx，谷歌，微软？有了Google和微软，他们有10秒的限制是很正常的。但是，使用CMUSphinx这不应该发生。但是，您可能需要了解如何设置ASR系统。

来源

2017-07-27 21:46:07

感谢您的回复。大约10秒钟之后，从执行Python脚本的那一刻起，我的Raspberry Pi将会监听大约10秒。现在这不是Pi本身的问题，这是在SpeechRecognition方面，我发现10秒是它能够识别的最大值。现在你提到了Pocketsphinx，我读了一下它，但我并没有不停地听。你知道它是否能够直接从麦克风识别吗？或者它只能从WAV文件中识别出来。你也有任何好的Pocketsphinx教程吗？ –

连续语音识别

回答

相关问题