2010-06-10 50 views
4

有谁知道有哪些支持良好的/可靠的将Microsoft Word文档转换为MP3或WAV格式的方法,这样听力受损的人就可以“聆听”我存储在基于Web的文档管理系统中的文档?是否有.NET库/实用工具将Word文档转换为MP3格式?

我已经建立了这样的界面,使得有人可以使用电话来获取可用文档列表,并且日期和标题通过电话“读取”给他们,但是现在我希望能够让其他人真正地收听存储在系统中的Word文件的内容。

理想情况下,一个.NET库或实用工具可以让我在每次上传后转换DOC - > MP3,但是按需读取文件也是可以的。

+1

所以,你已经有一个文本到语音丽brary?你只需要从word doc中获取文本? – dotjoe 2010-06-10 18:25:02

+0

这是一种可能性,你有建议吗?我可以做这项工作。 – 2010-06-10 18:44:56

+0

如果你不是无条件限制.NET,并且至少部分涉及Java的解决方案是一个选项,你可以看看_Apache POI_('http:// poi.apache.org /')。您可以使用它从Word'.doc'文件中提取文本,然后通过文本到语音转换器来获取文本。 – stakx 2010-06-10 20:06:04

回答

2

如果您的Word文档以采用Office 2007引入的新OpenXML格式存储,则可能需要查看菊花工具链。

SourceForge上有一个免费的转换器,用于从您的Word文档创建一个Daisy文件。屏幕阅读器可以理解Daisy格式,并且还有转换器可用于将Daisy文件转换为音频文件。

有关详细信息,请参阅:

1

你可以试试Panopreter它有一个免费的专业版本。我以前用过它,取得了相当不错的成功。

我不确定免费版本是否可以直接保存到mp3,但您可以随时使用另一个程序将输出录制到mp3。

1

我想可能使用mintext命令行版本首先.doc文件转换为文本,然后在数据库中存储本文(上传时,也许?)

然后使用任何文本到语音库转换和保存这个文件,可能有一个引用ID将这个文件链接到数据库中。

2

从Word中获取文本是很容易的部分。有一些tts图书馆可用,但货物往往很贵。 Acapela(http://www.acapela-group.com)可能是我找到的最好的,API支持输出到声音文件。我不确定是否支持MP3,但转换声音格式很简单。

祝你好运。

4

您可以使用System.Speech.Recognition来配置您的TTS引擎和System.Speech.Synthesis命名空间进行录制/保存(保存为.WAV)。在System.Speech.AudioFormat中,您可以配置WAV文件的输出参数。对于Word,您只需使用COM Interop即可获取文件,打开文件并获取所需的任何类型的文本,然后将其输入到受管理的SAPI中。我可能会将其分成Paragraphs/Runs,Tables,References和Other。

如果您正在寻找更强大的技术,其中一个更知名的TTS引擎是NaturallySpeaking's Server SDK--他们最近添加了“音频流”功能,允许即时TTS,因此不需要预先录制永久音频文件(但是如果你愿意,它也可以预先录制)。您还可以查看他们的AudioMining SDK,它允许在音频文件中对语音文本进行全面索引和搜索。他们的SDK虽然都是COM,而不是.NET。

相关问题