2016-02-19 47 views
4

我可以使用EN-US东西来与Sphinx4,没有问题使用德语词典和语言模型:与Sphinx4

cfg.setAcousticModelPath("resource:/edu/cmu/sphinx/models/en-us/en-us") 
cfg.setDictionaryPath("resource:/edu/cmu/sphinx/models/en-us/cmudict-en-us.dict") 
cfg.setLanguageModelPath("resource:/edu/cmu/sphinx/models/en-us/en-us.lm.bin") 

我可以用它来录制的英语声音文件记录。我想用德文录音。在网站上,我找到一个链接Acoustic and Language Models。其中有一个档案“德国Voxforge”。它它我找到声学模型路径的相应文件。但据我所知,它不包含字典或语言模型。

我如何在Sphinx4中获得字典和语言模型德语的路径?

回答

3

您自己创建它们。您可以从字幕或维基百科转储中创建语言模型。该文档是here

最新的德国模型实际上不在CMUSphinx页面上,它们在github/gooofy。在这个幽默的项目中,你可以找到字典文档,模型和相关的数学。

+0

对不起。澄清。从gooofy下载,我应该使用'voxforge.dic'(26K字,而en-us有134K)和'voxforge.lm.DMP',对吧? –

+0

是的,他们工作。文件结尾必须更改为小写'.dmp',因为Sphinx4只能识别小写的扩展名。 –