2016-01-21 34 views
1

由于某种原因,我无法再访问Chrome内置的pdf查看器中的PDF文本。Watir-Webdriver如何使用Watir浏览器在Chrome中获取嵌入式pdf文本

@browser.text 
=> "" 

的PDF内嵌,我一直无法轻松地与Net/HTTP获取或curbhttparty得到它。但它在浏览器中显示为白天...

我需要做些什么与@browser.driver#some_method?或者可能在Watir::Browser.new :chrome之前更改功能散列?

现在人们在做什么来检查Web应用程序中的PDF文本,以及最近Chrome和Chromedriver的变化?

回答

1

Watir非常适合处理html,但不能处理pdf等格式。如果你想解析PDF文件,你可以尝试像pdf-reader

require 'pdf-reader' 
require 'open-uri' 

io = open(@browser.url) 
reader = PDF::Reader.new(io) 
reader.pages.first.text 
相关问题