2010-12-04 92 views
1

可以使用Microsoft Word自身支持的Word Interop打开任何文件格式吗?在.NET中读取文档

我的任务看起来很简单,我需要从任何常用文档类型(基于内容的文档比较)中读取文本,只有文本。有没有办法比上面提到的Word Iterop更容易做到这一点?有没有免费库来做到这一点?或者打开任何(.doc,.docx,.pdf,.rtf,openoffice文档等)文档类型?我很忙,但还没有找到太多的解决方案,而且我无法研究所有格式的800页规格。

P.S .:分开处理PDF是好的,以及具有所有类型的库。

回答

0

我工作的一个名为Toxy新的框架。它的目标是从您提到的各种文档中提取数据/文本。第一个版本将在明年初发布。(也许是2月)你可以在这里找到一些实现:https://github.com/tonyqus/toxy。但现在还没有准备好。