2014-09-20 34 views
1

我正在开发一个ASR使用PocketSphinx和我已经遵循此page的每一步。当我运行pocketsphinx_continous我得到以下错误:语言模型/集不包含</s>

ERROR: "ngram_search.c", line 221: Language model/set does not contain </s>, recognition will fail 

我的语言模型包含了和/s的标签虽然。

我的语言模型如下:

This is an ARPA-format language model file, generated by CMU Sphinx 
\data\ 
ngram 1=3 
ngram 2=1 
ngram 3=1 

\1-grams: 
-0.4770 <s>Alif</s> -0.3010 
-0.4770 <s>Baa</s> 0.0000 
-0.4770 <s>Jeem</s> 0.0000 

\2-grams: 
-0.1761 <s>Alif</s> <s>Baa</s> -0.1249 

\3-grams: 
-0.3010 <s>Alif</s> <s>Baa</s> <s>Jeem</s> 

\end\ 

从中将其设定为语料文件是:在解决这一问题

<s> Alif </s> 
<s> Baa </s> 
<s> Jeem </s> 

援助表示高度赞赏。

+0

你可能要共享的语言模型单独列项,它很可能不包含,你需要更好地检查它。 – 2014-09-21 06:54:13

回答

2

当您准备好语料库时,您在<s>和Alif之间没有空格,因此lm培训将<s>Alif</s>统计为一个单词。你应该有存在的空间和适当的语言模型应该是这样的:

\data\ 
ngram 1=5 
ngram 2=6 
ngram 3=0 


\1-grams: 
-0.3010 </s> 0.0000 
-99.0000 <s> -7.3814 
-0.7782 Alif -99.0000 
-0.7782 Baa -99.0000 
-0.7782 Jeem -99.0000 

\2-grams: 
-0.4771 <s> Alif 0.0000 
-0.4771 <s> Baa 0.0000 
-0.4771 <s> Jeem 0.0000 
0.0000 Alif </s> 0.0000 
0.0000 Baa </s> 0.0000 
0.0000 Jeem </s> 0.0000 

\3-grams: 

\end\ 

这个正确的LM有</s>