2012-04-18 85 views
1

我正在处理lxml以获取html页面。
我想获取类名为'class1'的html表。
我做了这样的事情:在使用lxml的HTML解析中使用相同类名的多个表格

for span in doc.xpath('//table[@class="class1"]'): 
print span 

但是,
在此之后我发现,有4个表中的HTML网页,其中有类名称为“class1的”。
例如:

table A 
table B 
table C 
table D 

这些所有4代表具有相同的类名。
我怎样才能取得表B?

回答

3

你可以得到列表的第二个项目:

 
result = doc.xpath('//table[@class="class1"]') 
if len(result) > 1: 
    print result[1] 

或者,如果你的表中有ID,您可以通过XPath的得到它:

 
print doc.xpath('//table[@id="you id"]')[0] 
+0

aha ok。我会尝试 – sam 2012-04-18 04:53:29

2

我想你可能想在这里...

doc.xpath('//table[@class="class1"]')[1] 
+0

谢谢你的回答。这很有帮助。 – sam 2012-04-18 05:08:43