2011-08-31 192 views
0

我想在字符串中SEACH为标题标签,我正在寻找一个正则表达式找到像何标题标签出现在文档中的索引,所以东西:Python的正则表达式

str.index('<h*>') 

在哪里*代表只有1个字符,即。 1,2,3等消除任何头标签或html标签

任何帮助将不胜感激。

+0

你可以使用''或'] +>'如果你想匹配''(例如:它有其他属性 – NullUserException

+0

谢谢大家 – Ruth

回答

1
import re 

matches = re.finditer('<h[1-6]>', your_text) 
for match in matches: 
    print match.start() 
0

您所需要的正则表达式是这样的:

<h.> 

这将匹配<h1>, <h2>, <hr>,等等...如果你只想匹配标题标签,使用:

<h\d> 
+0

水平规则不是标题。 – NullUserException