2013-03-23 195 views
7

有没有免费的服务/程序将音频转录为文字 并保留时间戳?免费时间戳音频转录(语音到文本)?

我要抄写:

This is the demo link of VoiceBase

(419个诈骗者之间向16m谈话;骗子用 重的口音说话,所以我不抱怨 转录的质量)。

声明库将其转录,但转录是测试的单个块 ,并且未加时间戳。

我也尝试了谷歌语音“绝招”(记录文件转换成语音邮件 和谷歌有它抄写在时间3分钟),但同样,在 转录是一个单独的文字块,不timestampped。

我知道狮身人面像,但不能得到它的工作。

我意识到我可以使用subtitleeditor创建一个手动转换, 但我正在寻找一个自动化的解决方案。

理想情况下,我想采取时间戳机器转录和手工编辑它。

+0

CMUSphinx可以以比Voicebase更高的准确度转录此文件。欢迎您提供文件本身的链接,我会为您提供示例时间戳和转录。 – 2013-03-23 18:38:26

+0

谢谢!如果帖子中的网址不起作用,请尝试http://s3.amazonaws.com/plivocloud/4c743546-7e1b-11e2-9060-002590662312.mp3(如果它有效,我会做更多的努力来获得狮身人面像在我自己​​的机器上工作和/或与你交朋友) – barrycarter 2013-03-23 22:01:18

+0

对不起,我已经给你添加了下面的例子。 – 2013-04-01 13:37:19

回答

5

CMUSphinx可以做到这一点,只需从源代码运行Aligner演示。最新的sphinx4教程可用in sphinx4 tutorial。在2014年夏天,CMUSphinx在sphinx4主干中集成了long audio alignment功能。

这是完全错误的,但与语音库不同,它至少捕获了一些单词。可能更容易手动转录它并稍后分配时间。 CMUSphinx也可以通过音频到文本对齐来实现。

由于重音和短音引起的解码精度有很多问题,但也有一些东西你也要负责。例如,你不应该把8khz bandwith的电话音频转换成mp3。这种转换极大地降低了自动语音识别的准确性和整体记录质量。您可以使用其他面向语音的无损编解码器进行压缩。

其他question讨论这个问题,列出一些建议。

+0

谢谢,尼古拉!该文件直接来自plivo.com,所以我不认为我有 格式的选择。我继续前进,手动创建了一个 .srt文件,用于此录音的前3分钟,并且还在这3分钟内上传 Google语音副本 (https://github.com/barrycarter/bcapps/tree/master/SOUND )。我将使用您的数据 创建一个SRT文件以与我的数据进行比较。 – barrycarter 2013-04-01 15:24:24

+0

好的,太好了。询问你是否需要更多帮助。 – 2013-04-01 15:41:26

+0

如果您可以通过电子邮件/ Google Talk聊天,我是[email protected] - 我可以咀嚼您的(虚拟)耳朵几天;) – barrycarter 2013-04-01 15:42:43

0

如果在谷歌搜索,你会得到由实例市场professionals.Some供电转录软件的一个长长的清单是:

  1. 快递抄写
  2. EureScribe
  3. InqScribe

但使用自动化软件时发生的问题是,它不提供我们需要的确切结果。所以,如果您仍然在使用这些软件时遇到任何问题,那么您可以聘请一名抄写员来缓解您的工作。

0

名为Speechlogger的新软件(chrome web-app)(https://speechlogger.appspot.com)正是为此目的而制作的。它会保留时间戳,并让您输出到srt (captions) format

它应该是最好的技术,因为它利用了Google的语音识别引擎。它也自动标点(基于简单的单词内容和结构)。