我想在字符串中SEACH为标题标签,我正在寻找一个正则表达式找到像何标题标签出现在文档中的索引,所以东西:Python的正则表达式
str.index('<h*>')
在哪里*代表只有1个字符,即。 1,2,3等消除任何头标签或html标签
任何帮助将不胜感激。
我想在字符串中SEACH为标题标签,我正在寻找一个正则表达式找到像何标题标签出现在文档中的索引,所以东西:Python的正则表达式
str.index('<h*>')
在哪里*代表只有1个字符,即。 1,2,3等消除任何头标签或html标签
任何帮助将不胜感激。
import re
matches = re.finditer('<h[1-6]>', your_text)
for match in matches:
print match.start()
您所需要的正则表达式是这样的:
<h.>
这将匹配<h1>, <h2>, <hr>
,等等...如果你只想匹配标题标签,使用:
<h\d>
水平规则不是标题。 – NullUserException
你可以使用''或'] +>'如果你想匹配''(例如:它有其他属性 –
NullUserException
谢谢大家 – Ruth