我正在用PHP直接从PDF文件中提取低级图像,因为GhostScript太慢了,而且我做得很好。但问题是,我无法弄清楚它说图像属于哪个页面的地方。我从PDF中获取图像没有问题,但我无法弄清楚它们的顺序。如何知道PDF规范中图像属于哪个页面?
在PDF数据中的哪个位置表示图像应显示在哪个页面上?
我正在用PHP直接从PDF文件中提取低级图像,因为GhostScript太慢了,而且我做得很好。但问题是,我无法弄清楚它说图像属于哪个页面的地方。我从PDF中获取图像没有问题,但我无法弄清楚它们的顺序。如何知道PDF规范中图像属于哪个页面?
在PDF数据中的哪个位置表示图像应显示在哪个页面上?
图像作为独立对象存储在PDF中。它们通过页面的资源字典XObject子字典从页面引用。关系是页面 - >资源 - >图像,所以为了知道图像属于哪个页面,您必须扫描所有页面的所有资源字典,并查看您的图像出现在哪些资源字典中。图像可以从多个资源字典中引用。这是非常低级别的PDF操作,我不知道你的代码工作水平有多低。
如果你可以分享你在做的细节,我们可以帮助 – aWebDeveloper
我从PDF中提取图像...用记事本+ +打开PDF,你会看到它的样子。 – Alasdair
搜索分页符,但你做什么可能是不对的 – aWebDeveloper