2010-10-28 133 views
1

在我的网站上,我将上传的PDF文件显示在Flash播放器中供我的用户阅读。计算PDF文档中特定文本的x和y坐标的宽度和高度

我已经使用各种工具来提取文本,并从文件中产生严重的高质量图像,并且系统运行良好。

拼图的最后一部分是能够突出文档的特定部分,以帮助用户解决无障碍问题。

但是我不知道如何计算特定文本在页面上的位置?

注:

  • 上传到系统中的文件是从第三方,因此字体可以嵌入。这意味着我无法确定特定字母的宽度。
  • 文字加以强调可能不是唯一的,相同的文本可以重复

我如何计算在一个PDF一段特定文字的坐标,高度和宽度,让我可以然后围绕它画一个盒子?

回答

1

我已经在www.quickpdf.com上使用了一个名为QuickPDF的SDK作为最近的项目。

他们有一个叫做ExtractFilePageText()函数,它就能返回文本,字体,边框坐标。

提取选项包括: - 在人类可读的格式

0 =提取文本 2 =返回一个CSV串包括页面 使用更多的字体,颜色,大小和每一块 文本的位置准确文本提取算法: 3 =返回一个CSV串,每件文本的页面上,使用下列 格式: 字体名称,文本颜色,文本大小,X1,Y1,X2,Y2,X3,Y3,X4, Y4,文本 的坐标是四个点包围的文本中,在测量点(1/72英寸 )与的左下角为原点 4 =类似选项3,但个别单词的页面返回,使得搜索 的话更容易。

需要开发者许可证,但没有运行时版税。它有许多其他有用的功能,并与许多语言一起工作。 documentation也很不错。

+0

这看起来不错。谢谢安德鲁。 – 2010-11-02 10:12:28

相关问题