语音识别语言模型

我想将语音识别集成到我的Android应用程序中。语音识别语言模型

我知道谷歌提供了两种语言模式（短语听写和网页搜索的自由格式）。

但是，我的应用程序将有可能的词数量有限（可能几千）。是否可以指定词汇表;将其限制在这些词语中，以期达到更准确的结果？

我的直接想法是使用网络搜索语言模型，然后根据我的词汇检查结果。

任何想法赞赏。

我认为你的直觉是正确的，你已经回答了你自己的问题。

由google提供的内置语音识别功能仅支持听写和搜索语言模型。请参阅http://developer.android.com/reference/android/speech/RecognizerIntent.html

您可以使用这些识别器模型获取结果，然后对结果进行分类或过滤，以找到最适合您的有限词汇表的结果。有不同的技术可以做到这一点，他们可以从简单的解析到复杂的统计模型。

我见过的唯一另一种选择是在服务器上使用其他语音识别功能，以接受您的专用语言模型。虽然这是昂贵和复杂的，并被VLingo或龙或微软的Bing等商业语音公司使用。

2010-10-14 12:54:09

您可以使用像Voxforge这样的Opensource模型或像Lumenvox这样的廉价模型。一些已被移植到android。我忘记了谁。

2010-12-27 22:19:31

我回答几乎相同的问题之前 - 请点击这里：Building openears compatible language model

这里：

通常需要非常大的语料库产生有用的语言模型。

如果你只有少量的训练数据，你的语言模型将被过度拟合，这意味着它不会推广。

2011-10-05 01:37:59 Tilo

回答