pdfbox

    3热度

    3回答

    我想将不可见文本插入到现有PDF文件中,以使其可搜索。 我应该使用什么库? 我希望链接到特定的API方法使用。 自由,理想的开源。 非常感谢! (对于好奇:我想自动OCR扫描入方向带纸,让他们searcheable,在露天仓库)

    1热度

    1回答

    有谁知道采用pdf文档的最佳方式,并替换所有匹配模式的子字符串([AZ] [AZ] [AZ]'' [0-9] [0-9] [0-9] [0-9] | [AZ]),并用相同字符串的超链接替换为相同的字符串。 我打算允许用户查看pdf文档(这是他们可以拿到的学位课程列表),并允许用户点击一个班级,以便将其添加到列表中。 我知道我可以一个hyperlinklistener添加到JEditorPane中,

    2热度

    2回答

    我正在使用PDFBox从PDF中提取文本。 PDF有一个表格结构,它非常简单,列间距也非常宽。 这个工作非常好,除了所有类型的水平空间都被转换为单个空格字符,所以我不能再分开各列(一列中的空格看起来就像列之间的空格)。 我明白,一个通用的解决方案是很辛苦,但在这种情况下,列是真的相距甚远,使得具有“长间隔”和“字与字之间的空间”之间的简单区别就足够了。 有没有办法告诉PDFBox将多于x英寸的水平

    0热度

    1回答

    我试过用iText和PDFBox。 这并不简单,我们需要了解很多代码。 任何人都可以提供使用Java应用程序读取和写入PDF的简单方法。 确保应用程序是独立的,并且不需要任何Web /应用程序服务器。

    2热度

    1回答

    我尝试从我的Java应用程序导出一些数据到PDF文件。我决定使用pdfBox库,但我意识到我无法将希腊字符正确显示到pdf文件中。有没有办法设置编码?到utf8或iso-8859-7?我尝试类似于PdFontEncoding或Encoding,但我没有得到任何东西。 谢谢你的时间。

    1热度

    1回答

    我希望有人能够对此有所了解。看起来我需要用[SERIALIZE]选项重新编译PDFBOX。但我不知道如何。 我想要做的是将PDDocument doc对象存储在数据库中。 错误:在程序集'PDFBox,Version = 0.0.0.0,Culture = neutral,PublicKeyToken = null'中键入'org.apache.pdfbox.pdmodel.PDDocument'

    3热度

    1回答

    我想完成以下工作。我有一组PDF文件,首先我想检查坐标系的原点。如果pdf的坐标系的原点不是左上角[通常原点是左下角],我想创建一个带左上角坐标的结果PDF。我正在尝试使用PDFBox [下面的代码片段]来完成此操作,但是由此产生的PDF将变为空白,我做错了什么。我是PDFBox的新手,因此我非常赞赏这方面的任何帮助。 // loading the existing doc P

    2热度

    1回答

    我需要为使用PDFBox的服务器编写一个小程序。我正在使用NetBeans编写窗口。一旦我将它导出到服务器后,如何将PDFBox jar添加到我的程序jar中?

    0热度

    1回答

    我正在使用PDFBox从我的用户输入表单之一生成PDF。对于绘制线我使用PDPageContentStream.drawLine和文本PDPageContentStream.drawString。文本工作完美,但在使用drawLine时,当我尝试打印PDF时,出现如附图所示的错误。我的代码看起来像这样 PDPage page = new PDPage(); release.addPage(pag

    6热度

    3回答

    我有这样的Java代码: try { PDFTextStripper pdfs = new PDFTextStripper(); String textOfPDF = pdfs.getText(PDDocument.load("doc")); doc.add(new Field(campo.getDestino(), textOfPDF,