2010-10-14 118 views
1

我想将语音识别集成到我的Android应用程序中。语音识别语言模型

我知道谷歌提供了两种语言模式(短语听写和网页搜索的自由格式)。

但是,我的应用程序将有可能的词数量有限(可能几千)。是否可以指定词汇表;将其限制在这些词语中,以期达到更准确的结果?

我的直接想法是使用网络搜索语言模型,然后根据我的词汇检查结果。

任何想法赞赏。

回答

1

我认为你的直觉是正确的,你已经回答了你自己的问题。

由google提供的内置语音识别功能仅支持听写和搜索语言模型。请参阅http://developer.android.com/reference/android/speech/RecognizerIntent.html

您可以使用这些识别器模型获取结果,然后对结果进行分类或过滤,以找到最适合您的有限词汇表的结果。有不同的技术可以做到这一点,他们可以从简单的解析到复杂的统计模型。

我见过的唯一另一种选择是在服务器上使用其他语音识别功能,以接受您的专用语言模型。虽然这是昂贵和复杂的,并被VLingo或龙或微软的Bing等商业语音公司使用。

0

您可以使用像Voxforge这样的Opensource模型或像Lumenvox这样的廉价模型。 一些已被移植到android。我忘记了谁。

0

我回答几乎相同的问题之前 - 请点击这里:Building openears compatible language model

这里:

通常需要非常大的语料库产生有用的语言模型。

如果你只有少量的训练数据,你的语言模型将被过度拟合,这意味着它不会推广。