当我想用Python中的BeautifulSoup库解析XML文档时,我遇到了一些问题。我想解析的XML文档:解析非标准XML(CDATA标记)
<item>
<title><![CDATA[Title Sample]]></title>
<link /><![CDATA[http://banhada.kr/?cateCode=09&viewCode=S0941580]]>
<time_start>2011-10-10 09:00:00</time_start>
<time_end>2011-10-17 09:00:00</time_end>
<price_original>35000</price_original>
<price_now>20000</price_now>
</item>
正如您在上面看到的,标记有点奇怪。在我看来,(标签)不是一种立场XML形式,对吧?我怎样才能解析这种可怕的形式?
哇。感谢您的kandness – user513004
UserWarning:BeautifulStoneSoup类已被弃用。而不是使用它,将特征=“xml”传递到BeautifulSoup构造函数中。 –
更新了我的答案,以使用BeautifulSoup4。 – unutbu