2010-05-28 100 views
4

我需要能够确定两个声音是否非常相似。我们的目标是要有一个非常有限的词组(10或15个)短的一个或两个音节词,然后比较一个捕获的声音,以确定它是否是具有环境和捕获条件中所有常见变化的项目之一。这个想法是,用户可以通过语音而不是键盘或鼠标发出一些简单的命令。比较两个语音

有没有人知道最好的方法呢?我不想做全面的语音识别,只是更有限的一些。

+1

这是说话者独立的,还是要为特定的说话者训练? – 2010-05-28 21:38:31

+0

听起来有趣!我会对你得到的任何答案感兴趣。我所知道的关于言语的是,“形式”(频谱中的主峰)可以用来识别语言元素。我不确定真的语音识别软件是否使用该软件。 – erickson 2010-05-28 21:40:43

+0

您正在寻找“语音识别”。 – 2010-05-28 21:41:54

回答

3

我会重新考虑使用语音识别库......如CMU's Sphinx软件或Microsoft's speech recognizer。不幸的是,这并不是一项简单的任务。一种方法是有些典型的如何完成你正在尝试做的是如下:

1)印章的样品成小片段(几毫秒)

2)傅立叶每个段变换,收集校长系数

3)使用隐马尔可夫模型计算出音素的可能变换给您系数

的序列

4)映射到字典描绘音素的话(你可以看看狮身人面像字典作为一个指南)......像你这样的小组应该会产生出色的结果。


如果你想在一定程度上简化了这一点,你可以尝试采用系数在特定的时间步长,并将它们送入一个SVM或神经网络...我没有试过,但还敢打赌,你可以得到合理的结果进行一些调整。