2010-04-06 68 views
1

从网站的内容,我想如何让从UTF8格式的网站内容,,得到与UTF8格式

我已经写了下面的代码是

try { 
     String webnames = "http://pathivu.com"; 

     URL url = new URL(webnames); 

     URLConnection urlc = url.openConnection(); 

     //BufferedInputStream buffer = new BufferedInputStream(urlc.getInputStream()); 
     BufferedReader buffer = new BufferedReader(new InputStreamReader(urlc.getInputStream(), "UTF8")); 

     StringBuilder builder = new StringBuilder(); 

     int byteRead; 

     while ((byteRead = buffer.read()) != -1) 
      builder.append((char) byteRead); 

     buffer.close(); 

     String text=builder.toString(); 

     System.out.println(text); 
    } 
catch (IOException e) 
{ 
    e.printStackTrace(); 

} 

,但我不能得到正确的格式。 ..

感谢,并提前..

回答

1

您的代码看起来不错。这里的问题,这将是在服务器上的数据将无法在UTF-8格式..

+0

这个问题的任何解决方案? – zahir 2010-04-06 05:30:50

+0

请检查服务器从哪里得到的内容..你可以提供更多详细信息 – sreejith 2010-04-06 05:38:46

+0

我可以很容易地得到的内容,如果英文内容, 但其他格式显示像问号或其他符号... 什么你想要更多细节? – zahir 2010-04-06 06:14:47

3

的问题可能是您的控制台或您的System.out不是UTF-8。

  • 尝试写这一个文件,而不是
  • 设置通过System.setOut(..)

控制台流,您可能需要使用-Dfile.encoding=utf-8OutputStreamWriter

+0

或者坐在一个IDE内部时,配置工作区编码。在Eclipse是*窗口>首选项>常规>工作空间>文本文件编码*。这一个需要被设置为UTF-8(1)。 – BalusC 2010-04-06 13:25:35