我会建议一种方法接受字符串解析,在起始平衡符号之前的字符串,字符分隔符和包含或排除分隔符(标记)的标志。
见Java IDEONE demo:
public static List<String> getBalancedStr(String s, String strBefore, Character markStart,
Character markEnd, Boolean includeMarkers) {
Matcher m = Pattern.compile("(?=(\\b\\Q" + strBefore + markStart.toString() + "\\E.*))").matcher(s);
List<String> subTreeList = new ArrayList<String>();
while (m.find()) {
int level = 0;
int lastOpenBracket = -1;
for (int i = 0; i < m.group(1).length(); i++) {
char c = m.group(1).charAt(i);
if (c == markStart) {
level++;
if (level == 1) {
lastOpenBracket = (includeMarkers ? i : i + 1);
}
}
else if (c == markEnd) {
if (level == 1) {
if (includeMarkers) {
subTreeList.add(strBefore + m.group(1).substring(lastOpenBracket, i + 1));
} else {
subTreeList.add(m.group(1).substring(lastOpenBracket, i));
}
break;
}
level--;
}
}
}
return subTreeList;
}
使用范例:
String s = "2*-5+ sin(1.5*4)+(28- 3^4-(cos(3+(19*3)+1+(6/2))/2+tan(1+cos(1+9))-6/3+2.3*3.3345)+1)+1)-(4/2)";
System.out.println("cos: " + getBalancedStr(s, "cos", '(', ')', true));
// cos: [cos(3+(19*3)+1+(6/2)), cos(1+9)]
System.out.println("sin: " + getBalancedStr(s, "sin", '(', ')', true));
// sin: [sin(1.5*4)]
System.out.println("tan: " + getBalancedStr(s, "tan", '(', ')', true));
// tan: [tan(1+cos(1+9))]
注意,这个方法编译正则表达式 - "(?=(\\b\\Q" + strBefore + markStart.toString() + "\\E.*))"
- 将匹配cos
或者只是作为一个完整的单词sin
(因为\b
是一个字的边界)和.*
将匹配到行的末尾。如果您想要支持多行输入,请在前面使用(?s)
:"(?s)\\b\\Q" + strBefore + markStart.toString() + "\\E.*"
。由于该模式位于未锚定的积极预测中的捕获组中,因此我们收集所有重叠匹配,并且每次匹配只会得到1个平衡子串(因为在找到相应的匹配结束分隔符后,我们跳出for
循环。
代数表达式不是一种常规语言。使用合适的解析器。 – hop
http://stackoverflow.com/a/5475880/5812121 – timolawl
那么,[当前重复](http://stackoverflow.com/questions/5475804)/regular-expression-for-math-operations-with-brackheses)问题涉及表达式中的任何''单元,而这个问题只问如何得到单位'cos(...)'。 –