我有做以下如何将Net :: HTTP响应转换为Ruby 1.9.1中的某种编码?
- 检索一个HTML页面西纳特拉应用(http://analyzethis.espace-technologies.com)(通过网/ HTTP)
- 从response.body
- 创建一个引入nokogiri文档中提取一些信息,并发送它回到了回应。该反应应该是UTF-8编码
我到了这个问题,而试图读取使用windows-1256编码方式,如www.filfan.com或www.masrawy.com网站。
问题是编码转换的结果不正确,虽然没有发生错误。
净/ HTTP response.body.encoding给ASCII-8BIT不能转换为UTF-8
如果我做引入nokogiri :: HTML(response.body),并使用CSS选择器来获得某些来自页面的内容 - 比如标题标签的内容 - 例如,我得到一个字符串,当我调用string.encoding时,返回WINDOWS-1256。我使用string.encode(“utf-8”)并使用它发送响应,但是响应又不正确。
有关我的方法中出现问题的任何建议或想法?
它很棒! – 2016-10-28 13:32:02