2013-01-23 28 views
0

下面一个就是我在这个URL解析链接标签Android的DOM解析链接标签

http://www.mobileapp.pcmac.org/mobile/xml/sisapp.asp?sid=353&pn=news2

数据

<item> 
     <title>DATA WAREHOUSE (Quick link and training information)</title> 
     <category> News</category> 
     <description></description> 
     <pubDate>Tue, 1 Dec 2009 00:00 CST</pubDate> 
     <enclosure url="" length="0" type="image/jpg" /> 
     **<link>http://www.mcpss.com?PN=&apos;News2&apos;&amp;SubP=&apos;DNewsStory&apos;&amp;gn=&amp;NewsID=17662&amp;ShowNav=&amp;StoryGroup=Current</link>** 
    </item> 

我是从上解析链接代码的网址data.but当我试图把这个值在下面的代码它抛出以下异常: HTTP错误获取URL

try { 
      String website=list.get(0); 
      Document doc = Jsoup.connect(website).get(); 
      Elements el=doc.getElementsByClass("header"); 
      Elements atr= doc.select("p span"); 
      String ss=""; 
      for(Element s:atr) 
       ss+=s.text(); 
       String text=el.text(); 
       t1.setText(text); 
       t2.setText(ss); 
    } catch (Exception e) { 
log.d("Error",e.getMessage()); 

       } 

如果我硬编码链接值它工作正常。我需要一些帮助来解决这个问题。

回答

0

首先,您需要检查您的解析是否正常工作。所以使用println或类似的。如果网址已被确认,您可以进行下一步操作。

大多数问题发生在重定向。

在您的例子解析链接将是:

http://www.mcpss.com?PN=&apos;News2&apos;&amp;SubP=&apos;DNewsStory&apos;&amp;gn=&amp;NewsID=17662&amp;ShowNav=&amp;StoryGroup=Current 

实际的网站重定向到的是:

http://www.mcpss.com/?PN=&apos;News2&apos;&amp;SubP=&apos;DNewsStory&apos;&amp;gn=&amp;NewsID=17662&amp;ShowNav=&amp;StoryGroup=Current 

你可以看到一个斜线已添加。尝试使用jsoup连接到最终的url。如果这样做比您需要首先解析所有链接并在使用jsoup连接到它之前添加斜杠。如果适用,它应该是所有网址的持续计划。

希望它有助于

+0

非常感谢您的帮助 –