2012-08-06 136 views
0

我想捕捉一些HTML标签的价值。 可能是这样的:结合正则表达式解析

value='3242312-3245-3245,234:3245:324,asdf asdf,asdf asd'> 

或像这样:

value=358 > 

,也许这样的:

value=83 selected='selected'> 

我想:

Pattern.compile("value=[[\'(.+)\'][(0-9)\\s]]") 

,但没有成功...

任何想法应该使用什么样的模式?

+3

为什么不您使用HTML解析器来解析HTML?这就是他们的目标。 – Blender 2012-08-06 23:26:26

+0

value属性的possbbile值是什么? – Razvan 2012-08-06 23:26:35

+3

定义“不成功”。你在做其他解析吗?如果是这样,http://stackoverflow.com/a/1732454/438992。 – 2012-08-06 23:31:23

回答

0

这种表达应该工作:

(?<field>\w+)=(('(?<value>[^']*)')|(?<value>\S+)) 

您可以使用相同的表达W/O组的名称(因为该工具不支持)测试here

(\w+)=(('([^']*)')|(\S+))