比方说,我有一个XML字符串<tagA>
许多OCCURENCES:Java的替代正则表达式的所有出现的与另一个正则表达式
String example = " (...) some xml here (...)
<tagA>283940</tagA>
(...) some xml here (...)
<tagA>& 9940</tagA>
<tagA>- 99440</tagA>
<tagA>< 99440</tagA>
<tagA>99440</tagA>
(...) more xml here (...) "
内容应该只包含数字,但它也有一个随机字符后跟一个空格和数字。 我想删除不需要的字符和空格。怎么做?
到目前为止,我知道我应该寻找一个正则表达式"<tagA>. [0-9]*<\/tagA>"
,但我被困在这里。
我想更换,因为这些字符中的人物有“&”,“>”,“<”的迹象,这使得该XML无效的(这让我无法治疗这种为XML)。
[不要使用正则表达式解析XML(https://stackoverflow.com/questions/701166/can-you-provide-some-examples-of-why -it-is-hard-to-parse-xml-and-html-with-a-reg) – VGR
在谓词中使用XPath和'starts-with'函数。 –
我无法解析XML,因为它无效。 (&字符使xml无效) – Simon