2009-01-18 119 views
5

我打算启动一个将语音转换为Linux中的文本的应用程序。 是否有任何现有的接口,以便我可以扩展它们? 还是在Linux中有这样的现有应用程序? 对此有何意见?Linux中的语音转换为文本

编辑:我计划编写的应用程序应该能够将每个单词都转换为文本,而不仅仅是是/否。

回答

8

嗯,这是一个相当的承诺,并没有说要使用什么样的技术,这里有一些链接:

祝你好运。更详细地说,我们可能会提供更好的答案。例如,“是/否”呼叫中心式识别与部分自然语言理解之间存在很大差异。

3

戴夫的建议是一个很好的开始。狮身人面像非常漂亮。

我只是想补充一点,你应该尽可能概率。作为一次性的语言学家,甚至更早的一次音韵学迷,我可以自信地说,不要被语言模型所困扰。让我们不要忘记,“每次我发起语言学家,我的准确度都会提高”。它的确关于模型及其解决噪音和变异的能力,而不是麻省理工学院的文科专业必须说的。

一本好书是Jurafsky和Martin的“言语和语言处理”。它有一些非常有用的计算模型的应用程序。 Harvey Sussman关于各种元音的F2斜率的线性相关性研究(从谷仓猫头鹰开始并朝着人类的方向开始)看起来似乎是在这些日子里模型中实现的一件好事。

1

狮身人面像是你在linux上最好的选择。我曾试过狮身人面像II和狮身人面像III。有一些开源语言和声学模型可用于它们中的每一个。完全不是生产级别的性能,但足以满足原型设计或演示。对于制作,您需要开发自己的语言和声学模型。