这可能是与其他韩国编码的问题不同。C# - 韩国编码
有这个网站,我要刮,它是韩国人。
在他们的网站的一个例子句话是这样 “为了保护您的隐私,请使用返回按钮在搜索结果屏幕,而不是后退按钮的顶部和底部。”
我使用HttpWebRequest和HttpWebResponse刮网站。
这是我retreive的HTML
- 部分代码 -
using (Stream data = resp.GetResponseStream())
{
response.Append(new StreamReader(data, Encoding.GetEncoding(code), true).ReadToEnd());
}
我现在的问题是,我没有得到正确的韩语字符。在我的“代码”变量,我在这里在MSDN http://msdn.microsoft.com/en-us/library/system.text.encoding.aspx基础的代码页(让我缩小它)。
这里是韩国的代码页: 51949,50225,20949,20833,10003,949
,但我仍然没有得到正确的韩语字符?什么问题?
什么编码的页面中?它是否有任何元标签?那么http头文件呢? – Oded 2012-04-05 15:49:01
它只是头部EUC-KR,但我已经使用这个名字Encoding.GetEncoding(“EUC-KR”),并仍然得到了错误的韩语字符。 ?逾?逾?冤蒂森ℓ?蹂????房子? ?ㅼ冤? ⑸??你怎么看? ????ㅻ?媛湲?逾????冤?冤gyelnaek?硫???④的Nack ??⑥?房屋逾?Soep?Ъ⑺?湲?谀???? – 2012-04-05 15:53:36
是否安装在执行该刮的计算机上的代码页? – Oded 2012-04-05 15:54:18