使用Mechanize解析格式错误的HTML（Ruby）

我想处理一个HTTP响应，其中包含很多HTML，但本身不是一个有效的HTML文件。使用Mechanize解析格式错误的HTML（Ruby）

我知道我可以使用Nokogiri如下：page = Nokogiri::HTML.parse(page.body)，但是，我想访问Mechanize方法，如Mechanize::Page.search。有没有什么办法使用这个HTML作为Mechanize::Page，或通过其他一些Mechanize类？

来源

2012-08-16 babonk

机械化:: Page.search - >这实际上是移交给一个引入nokogiri方法。您可以在Mechanize :: Page和Nokogiri :: HTMLDocument中使用'搜索'和'at' – pguardiario 2012-08-16 02:46:47

其实，貌似我已经找到了答案，以我自己的问题：

page = Mechanize::Page.new(URI.parse('http://example.com'), {'content-type'=>'text/html'},(page.body), 200, agent)

来源

2012-08-16 01:23:17 babonk

使用Mechanize解析格式错误的HTML（Ruby）

回答

相关问题