我想使用<br>
标记在我的html
中拆分文本。如果文本长度超过50个字符,我想用<br>
替换10个字符前的空格。如何更改re.sub中的原始匹配
的文本是<span class="value">TEXT</span>
例如<span class="value">cccc cc cccccc cccc cc c</span>
意志变成了:<span class="value">cccc cc<br>cccccc<br>cccc cc c</span>
所以每行最多可以有10个字符。
我已经为此创建了一个正则表达式,它可能会找到这样的标签,但无法弄清楚如何从匹配的组中提取文本,然后将其替换。
snippet = re.sub(r'<span class="value">(.*)<\/span>',
r'<span class="value">\1<\/span>'.(divide text using <br> tags)
你知道该怎么做吗?
Nooo ... do ** not **使用正则表达式解析,处理和生成XML/HTML。使用XPath,XSLT,BeautifulSoup,... –