2012-08-16 54 views
0

我想处理一个HTTP响应,其中包含很多HTML,但本身不是一个有效的HTML文件。使用Mechanize解析格式错误的HTML(Ruby)

我知道我可以使用Nokogiri如下:page = Nokogiri::HTML.parse(page.body),但是,我想访问Mechanize方法,如Mechanize::Page.search。有没有什么办法使用这个HTML作为Mechanize::Page,或通过其他一些Mechanize类?

+1

机械化:: Page.search - >这实际上是移交给一个引入nokogiri方法。您可以在Mechanize :: Page和Nokogiri :: HTMLDocument中使用'搜索'和'at' – pguardiario 2012-08-16 02:46:47

回答

2

其实,貌似我已经找到了答案,以我自己的问题:

page = Mechanize::Page.new(URI.parse('http://example.com'), {'content-type'=>'text/html'},(page.body), 200, agent)