2011-05-24 48 views
3

我正在写(或使用现有的)Web服务,它需要一个MS WORD和PDF文件,提取它的内容并将其作为文本返回。WORD和PDF到文本的Web服务

任何人都知道这样的服务或如何写一个?

回答

0

对于Word到文本,您可以使用antiword并将其输出传递到客户端。

对于PDF,有PdfTk - 它的dump_data操作可能会有用。

+0

谢谢。由于我在Web上托管了一个Web应用程序,因此我无法理解如何从Web应用程序调用这些程序。 – Oded 2011-05-25 10:56:40

+0

@Oded:取决于编程语言,但每个都有调用外部程序的方法。 – Piskvor 2011-05-25 11:26:17