2012-03-29 95 views
2

在我的要求从一个Word文档中创建PDF文档我要创建Word文档,使得使用的Java API

1)将每一页上的页码的PDF文件。

2)每行都会有行号,从每行的行号开始为1。

我们的应用程序是用java编写的,所以Java API会更有帮助。但是,如果在任何其他语言中更方便,那将是可以的。

+0

word文档包含什么? PDF应该有多完美? – 2012-03-29 11:14:05

回答

0

由于word文件无法读取像.txt文件,您将需要2 API

一个从doc文件读取数据,另一个将该数据写入pdf文件。

我们从doc文件中读取数据,可以使用APACHE-POI.

和数据写入pdf文件,你可以使用ITEXT

0

你可以尝试docx4j,尽管你需要做一些小小的改进来支持每一行的行号,并且可能更成问题,可能使用商用XSL FO处理器。

docx4j对PDF输出使用XSL FO,并且行编号不是1.0规范的一部分。 (它是XSL 2.0 requirements spec的一部分)

这意味着你必须使用支持供应商特定的扩展名的XSL处理器FO,例如Antenna House

UPDATE 2016 04

从V3 .3.0,docx4j默认使用我们的商业转换器,你可以在http://converter-eval.plutext.com/

0

我建议JODReports尝试或Docmosis因为你要开始一个word文档。您可以动态插入来自Java api的编号记录和分页符,这听起来像是他们将能够满足您的要求。

您还没有指定为什么要以word文档开头。如果您严格生成文档,则可能会放弃该要求并使用iText或docx4j。

+0

我们正在创建编辑管理系统并要求作者提交他们的脚本......对于这一要求,您认为我们可以使用哪种更好的文档格式? – samarth 2012-03-30 06:47:12

+0

如果作者向您发送他们的脚本,那么这与“每行的数字”有什么关系。你是否通过为每行添加数字来更改他们发送的文档? – 2012-03-31 07:10:19

+0

实际上,当我将这篇文档发送给审阅者时,他会对其进行审阅并给出他关于线号和页号的反馈。 – samarth 2012-04-02 05:44:39