标签这是我的HTML树如何分割从HTML树
<li class="taf"><h3><a href="26eOfferCode%3DGSONESTP-----------" id="pa1">
Citibank <b>Credit Card</b> - Save over 5% on fuel | Citibank.co.in</a>
</h3>Get the IndianOil Citibank <b>Card</b>. Apply Now!
<br />
<a href="e%253DGOOGLE ------">Get 10X Rewards On Shopping</a> -
<a href="S%2526eOfferCode%253DGSCCSLEX ------">Save Over 5% On Fuel</a>
<br />
<cite>www.citibank.co.in/<b>CreditCards</b></cite>
</li>
从这个网站,我需要提取beforeth的< BR>标签
线路1线:获得印度石油公司花旗银行卡。现在申请!
线路2:获取10X奖励安商场 - 节省超过5%的燃油
它是如何应该在Python呢?
如果这不是唯一的情况,你需要做更多这样的东西,看看一些(x)的HTML解析库。例如[美丽的汤](http://www.crummy.com/software/BeautifulSoup/)或[lxml](http://lxml.de/)。在标准库中,有[minidom](http://docs.python.org/library/xml.dom.minidom.html),但我不喜欢它,它可能不会在错误的语法(你在现实世界中会发现很多)。 – rplnt 2012-01-09 12:28:28