2011-04-11 55 views
0

我正在用python做一些网页抓取的东西。但正如你所知,一些网页有不同的字符集。我需要获得这些网页字符集。所以长话短说,对于lxml,什么是xpath模式?使用xpath获取(X)HTML文档中元元素的字符集属性

谢谢。

+0

你问如何获得一个'meta'元素的'content'属性的值? – 2011-04-11 01:03:21

+0

是的。这就是我正在寻找的。 – wonnie 2011-04-11 01:19:12

+0

好的,那么。回答。 – 2011-04-11 01:23:41

回答

2

此:

/html/head/meta[@http-equiv='Content-Type']/@content 

HTML5:

/html/head/meta/@charset