docsplit

2热度

2回答

使用docsplit gem我可以从PDF或任何其他文件类型中提取文本。例如，使用以下行： Docsplit.extract_pages('doc.pdf') 我可以拥有PDF文件的文本内容。我目前正在使用Rails，并通过请求发送PDF并存在内存中。查看API和源代码，我找不到从内存中提取文本的方法，只能从文件中提取文本。有没有办法让这个PDF的文本避免创建一个临时文件？如果它很重要，我

0热度

1回答

如何配置docsplit（ghostscript）的CID字体？

我在下面的url中有引导参考。 http://www.ghostscript.com/doc/9.06/Use.htm#CIDFonts 但我认为我没有正确遵守它。我想要做的是使用Docsplit将Office文件转换为图像。但某些字符（韩文&中文）显示为问号。我认为它与ghostscript有关，但因为我是基于Linux的解决方案的新手而感到很难。有人能告诉我关于如何配置CID字体的命

-1热度

1回答

Ghoshscript错误：错误：/ rangecheck in - 。dicttomark -

我正在尝试使用ghoshscript来转换PDF中的图像。的PDF为：http://www.coppernet.zm/MPLS.pdf $ sudo docsplit images -o /tmp/previews -p 1-5 -s 150,750,1000 -f png MPLS.pdf While reading gs_cidfm.ps: Error: /rangecheck in -

6热度

1回答

如何上传多页PDF并使用Paperclip将其转换为JPEG？

有谁知道如何用Paperclip上传多页PDF并将每个页面转换为Jpeg？到目前为止，每次我上传PDF时，它只允许我将PDF的第一页看作JPEG。但我希望能够将PDF中的每一页上传并转换为JPEG格式。是否有任何宝石或插件可以帮助我在数据库中上传10页PDF和转换/存储为10个JPEG文件？我看过docsplit-images宝石，但我不确定这是最佳解决方案还是它的工作原理。 Post.rb

6热度

1回答

在使用ruby应用程序时获取remove_entry_secure错误

我正在尝试使用docsplit将PDF文件分割为图像。但似乎我有我的红宝石安装问题。 /usr/lib/ruby/1.8/fileutils.rb:694:in `remove_entry_secure': parent directory is world writable 下面是完整的命令行输出： $ docsplit images pdf-test.pdf /usr/lib/ruby/

6热度

2回答

Docsplit Ruby on Rails

我试图让docsplit与我的Rails应用程序一起工作。现在我只是想让它在本地运行。我安装了gem和所有的依赖项。所有基本示例都在命令行中运行，我能够在我的Rails应用程序中使用 Docsplit.extract_pdf('example.doc') 。然而，当我尝试使用extract_images，即 Docsplit.extract_images('example.doc', :siz

1热度

2回答

Plone和文档查看器

我正在处理Plone。我已经成功安装了document-viewer：现在我对上传的PDF文件有很好的预览。问题驻留在世界和excel文件预览。根据要求，我必须安装OpenOffice或LibreOffice才能获得该结果。我做了什么来实现目标： yum install openoffice.org-writer yum install openoffice.org-calc 我上传一个

1热度

2回答

无法使用docsplit转换openoffice文档导致java.lang.NoClassDefFoundError

我已经安装了docsplit gem并能够转换PDF文档。然而，当涉及到分裂的OpenOffice文档，如PowerPoint和Word文件，我得到以下错误： Exception: Command /usr/local/bin/docsplit pdf /tmp/tmpzuk5gf/dump.ppt --output /tmp/tmpzuk5gf finished with return co