我输入的是:
<span question_number="18"> blah blah blah 1</span><span question_number="19"> blah blah blah 2</span>
寻找更好的正则表达式的解决方案
,我想我的正则表达式来此 <span question_number="somenumber">xxxx</span>
模式
匹配和所需的输出1.somenumber 2.xxxx
我写的一个天真的解决方案,可以覆盖
<span question_number="18"> blah blah blah 1</span>
<span question_number="19"> blah blah blah 2</span>
通知:他们在不同的林ES
输出为:18
,blah blah blah 1
和19
,blah blah blah 2
但是当输入为<span question_number="18"> blah blah blah 1</span><span question_number="19"> blah blah blah 2</span>
这是在同一行
我的输出是18
,blah blah blah 1</span><span question_number="19"> blah blah blah 2
我怎么会绕过这个问题?
更新: 正则表达式:/\<span question_number=(?:\")*(\d*)(?:\")*>(.*)<\/span>/ig
testinput:
情形1 - >的两行代码
<span question_number="54">often graces doorways tied into ropes called</span>
<span question_number="54">often graces doorways tied into ropes called <i>ristras</i>.</span>
情形2 - 的代码>一行
<span question_number="54">often graces doorways tied into ropes called</span><span question_number="54">often graces doorways tied into ropes called <i>ristras</i>.</span>
UPDATE2:
这不是一个dom,它是只是我想要处理的纯文本。
Update3: 所以我关于正则表达式的问题解决了,现在我有一个关于比较正则表达式或dom操作之间的速度问题?怎么可能实施这样的测试?
为什么你用正则表达式匹配HTML? http://stackoverflow.com/questions/590747/using-regular-expressions-to-parse-html-why-not – epascarello
我催促你阅读http://stackoverflow.com/questions/1732348/regex-match-open -tags-except-xhtml-self-contained-tags/1732454#1732454之前为时已晚 –
请问有人可以编辑这个吗? – evolutionxbox