我想剥离所有的div。从HTML字符串中删除所有的div标签
输入:
<p>111</p>
<div class="1334">bla</div>
<p>333</p>
<p>333</p>
<div some unkown stuff>bla2</div>
所需的输出:
<p>111</p>
<p>333</p>
<p>333</p>
我试过,但它不工作:
release_content = re.sub("/<div>.*<\/div>/s", "", release_content)
这很有趣,因为我实际上使用BeautifulSoup并决定使用正则表达式,因为我认为它不适用于BeautifulSoup :) – 2013-04-03 22:09:10