2016-11-30 102 views
0

我使用lxml库从HTML页面获取属性值。使用lxml提取属性值

例如:

<span class="you-save">Rs. 5000</span> 

我正在使用下面

print doc.xpath('//span[@class="you-save"]//text()') 

我想要得到的属性值正确的结果(5000),例如

<meta itemprop="price" content="4999.00"> 

我想要提取“4999.00”。我无法弄清楚这一点。

我在下面试过但没有得到任何结果。

print doc.xpath('//meta[@itemprop="price"]/content::text()') 

回答

1

您使用属性轴使用@来获取属性值。

例如:

from lxml.etree import fromstring 

xml = """<some> 
<nodes> 
<meta itemprop="price" content="4999.00"></meta> 
</nodes> 
</some>""" 

doc = fromstring(xml) 
print(doc.xpath('//meta[@itemprop="price"]/@content'))