docsplit

    2热度

    2回答

    使用docsplit gem我可以从PDF或任何其他文件类型中提取文本。例如,使用以下行: Docsplit.extract_pages('doc.pdf') 我可以拥有PDF文件的文本内容。 我目前正在使用Rails,并通过请求发送PDF并存在内存中。查看API和源代码,我找不到从内存中提取文本的方法,只能从文件中提取文本。 有没有办法让这个PDF的文本避免创建一个临时文件?如果它很重要,我

    0热度

    1回答

    我在下面的url中有引导参考。 http://www.ghostscript.com/doc/9.06/Use.htm#CIDFonts 但我认为我没有正确遵守它。 我想要做的是使用Docsplit将Office文件转换为图像。 但某些字符(韩文&中文)显示为问号。 我认为它与ghostscript有关, 但因为我是基于Linux的解决方案的新手而感到很难。 有人能告诉我关于如何配置CID字体的命

    -1热度

    1回答

    我正在尝试使用ghoshscript来转换PDF中的图像。 的PDF为:http://www.coppernet.zm/MPLS.pdf $ sudo docsplit images -o /tmp/previews -p 1-5 -s 150,750,1000 -f png MPLS.pdf While reading gs_cidfm.ps: Error: /rangecheck in -

    6热度

    1回答

    有谁知道如何用Paperclip上传多页PDF并将每个页面转换为Jpeg? 到目前为止,每次我上传PDF时,它只允许我将PDF的第一页看作JPEG。但我希望能够将PDF中的每一页上传并转换为JPEG格式。 是否有任何宝石或插件可以帮助我在数据库中上传10页PDF和转换/存储为10个JPEG文件? 我看过docsplit-images宝石,但我不确定这是最佳解决方案还是它的工作原理。 Post.rb

    6热度

    1回答

    我正在尝试使用docsplit将PDF文件分割为图像。但似乎我有我的红宝石安装问题。 /usr/lib/ruby/1.8/fileutils.rb:694:in `remove_entry_secure': parent directory is world writable 下面是完整的命令行输出: $ docsplit images pdf-test.pdf /usr/lib/ruby/

    6热度

    2回答

    我试图让docsplit与我的Rails应用程序一起工作。现在我只是想让它在本地运行。我安装了gem和所有的依赖项。所有基本示例都在命令行中运行,我能够在我的Rails应用程序中使用 Docsplit.extract_pdf('example.doc') 。然而,当我尝试使用extract_images,即 Docsplit.extract_images('example.doc', :siz

    1热度

    2回答

    我正在处理Plone。我已经成功安装了document-viewer:现在我对上传的PDF文件有很好的预览。 问题驻留在世界和excel文件预览。根据要求,我必须安装OpenOffice或LibreOffice才能获得该结果。 我做了什么来实现目标: yum install openoffice.org-writer yum install openoffice.org-calc 我上传一个

    1热度

    2回答

    我已经安装了docsplit gem并能够转换PDF文档。然而,当涉及到分裂的OpenOffice文档,如PowerPoint和Word文件,我得到以下错误: Exception: Command /usr/local/bin/docsplit pdf /tmp/tmpzuk5gf/dump.ppt --output /tmp/tmpzuk5gf finished with return co