2016-04-25 82 views
1

我正在研究一个项目,我必须将Pocketsphinx的语音功能集成到android应用程序中。事实上,我必须整合由Pocketpshinx提供的音位识别功能,这些功能应该能够识别法语的音素,例如, (如“de”,“re”,“se”等),辅音(如“m”,“f”,“g”等),双辅音(如“ kl“,”ks“,”gr“等)和元音(如”a“,”o“,”e“等)。 现在,我已经集成了Pocketsphinx来识别上面提到的音素,但是我的结果非常糟糕。例如,当我发音为“o”时,认可的结果有时是:“SIL ff ei au”(即使我根本没有发音字母“f”和“e”),或者在开始时出现了其他的东西这不明显。在开头出现的字母并不总是相同的(有时我会得到“ll”,“uu”等)。但有时,我发音的字母出现在开头(例如“a”,我得到“SIL aa SIL”),但这种情况很少发生。 那么,你们可以请帮助,让我知道可能是什么问题和解决这个问题的任何建议?我是否需要创建一个语言模型和一个字典,只有这些我感兴趣的字母(因为字母的数量是固定的)?或者,也许我需要做声学模型的自适应,或者训练声学模型?在Android,法语上使用音素识别的Pocketsphinx识别准确度差

非常感谢您提前!

Leutrim

回答

1

在模型中找到feat.params,并根据您的选择改变-cmuinit价值,而且,“-kws_threshold”1E-40F去除假警报值。

+0

你能否详述一下这些值? – Vaiden