我试图得到一个链接上的ISO-8859-1编码点击一个页面,所以代码与此类似:如何设置机械化页面编码?
page_result = page.link_with(:text => 'link_text').click
到目前为止,我得到的结果有错误的编码,所以我看到这样的字符:
'T�tulo:' instead of 'Título:'
我试过几种方法,包括:
使用代理偏大的,编码中的第一个请求:
@page_search = @agent.get( :url => 'http://www.server.com', :headers => { 'Accept-Charset' => 'ISO-8859-1' })
陈述的编码页面本身
page_result.encoding = 'ISO-8859-1'
但我必须做一些错误的:一个简单的放始终显示错误的字符。
你知道如何声明编码吗?
由于提前,
添加:可执行例如:
require 'rubygems'
require 'mechanize'
WWW::Mechanize::Util::CODE_DIC[:SJIS] = "ISO-8859-1"
@agent = WWW::Mechanize.new
@page = @agent.get(
:url => 'http://www.mcu.es/webISBN/tituloSimpleFilter.do?cache=init&layout=busquedaisbn&language=es',
:headers => { 'Accept-Charset' => 'utf-8' })
puts @page.body
遗憾的是它不工作... – Juan 2009-12-14 00:57:02