2013-03-12 203 views
3

我想从这个页面选择带有class = “RLTS刺” 的所有DIV http://www.amazon.fr/s/field-keywords=samsungJsoup:选择(DIV [CLASS =的rslt督促])返回时,它不应该

Document doc = Jsoup.connect("http://www.amazon.fr/s/field-keywords=samsung").get(); 
Elements divProd = doc.select("div[class=rslt prod]");  
System.out.println("\nsize: "+divProd.size()); 

但空返回0,它不应该,为什么?什么应该选择

例如:

<div id="result_4" class="rslt prod" name="B006O9QNHU"> 
[...] 
</div> 

回答

2

你必须改变用户代理,否则你从亚马逊网站不同的充。

Document doc = Jsoup.connect("http://www.amazon.fr/s/field-keywords=samsung") 
     .userAgent("Mozilla/17.0") // you can use any other user agent here 
     .get(); 

for(Element element : doc.select("div[class=rslt prod]")) 
{ 
    System.out.println(element); 
    System.out.println(""); 
} 

现在,输出类似

<div id="result_1" class="rslt prod" name="B007XOM6SU"> 
    ... 
</div> 

<div id="result_2" class="rslt prod" name="B006SXSF4Q"> 
    ... 
</div> 

... 
列表