2009-04-21 113 views
1

我有一位客户管理它将WordprocessingML内容粘贴到我们的应用程序中。据我所知,这是一个直接复制&从Word 2000粘贴到我们的Java应用程序。我尝试了每个Word和Java版本的组合,但我无法重现此行为 - 尤其是,因为我们的应用程序筛选了HTML和text/plain。有没有办法在java中获得WordprocessingML剪贴板内容?

我很确定旧版本的Office有自己的剪贴板并只导出格式,这些格式应该可用于其他程序。我知道的每个办公室版本(可能除了2007)都会导出HTML,RTF和Plain。

有没有什么办法让一个WordprocesingML内容到剪贴板,也许得到Java的混合式数据口味

回答

1

Apache POI是一个Java API来访问微软格式的文件。 HWPF是读写MS Word文件的一部分。 Apache TIKA是一个工具包,用于使用现有解析器库从各种文档中检测和提取元数据和结构化文本内容。它也为MS Word文档提供了一些支持。我建议你看看它们是否适合你的用例。

相关问题