2016-05-15 107 views
1

找不到适合这种数学表达式的模式:2*-5+ sin(1.5*4)+(28- 3^4-(cos(3+(19*3)+1+(6/2))/2+tan(1+cos(1+9))-6/3+2.3*3.3345)+1)+1)-(4/2)其中有(或不是) cos的内部括号。 理想的结果是:正则表达式的cos/sin/tan与内部括号内

1. cos(3+(19*3)+1+(6/2)) 
2. cos(1+9) 

我试图cos\(.+?\),但我只得到cos(3 + (19*3)。如果我正在尝试一个贪婪的量词,我得到整个字符串直到最后一个)

谢谢你提前!

+0

代数表达式不是一种常规语言。使用合适的解析器。 – hop

+0

http://stackoverflow.com/a/5475880/5812121 – timolawl

+1

那么,[当前重复](http://stackoverflow.com/questions/5475804)/regular-expression-for-math-operations-with-brackheses)问题涉及表达式中的任何''单元,而这个问题只问如何得到单位'cos(...)'。 –

回答

1

我会建议一种方法接受字符串解析,在起始平衡符号之前的字符串,字符分隔符和包含或排除分隔符(标记)的标志。

Java IDEONE demo

public static List<String> getBalancedStr(String s, String strBefore, Character markStart, 
           Character markEnd, Boolean includeMarkers) { 
    Matcher m = Pattern.compile("(?=(\\b\\Q" + strBefore + markStart.toString() + "\\E.*))").matcher(s); 
    List<String> subTreeList = new ArrayList<String>(); 
    while (m.find()) { 
     int level = 0; 
     int lastOpenBracket = -1; 
     for (int i = 0; i < m.group(1).length(); i++) { 
      char c = m.group(1).charAt(i); 
      if (c == markStart) { 
       level++; 
       if (level == 1) { 
        lastOpenBracket = (includeMarkers ? i : i + 1); 
       } 
      } 
      else if (c == markEnd) { 
       if (level == 1) { 
        if (includeMarkers) { 
         subTreeList.add(strBefore + m.group(1).substring(lastOpenBracket, i + 1)); 
        } else { 
         subTreeList.add(m.group(1).substring(lastOpenBracket, i)); 
        } 
        break; 
       } 
       level--; 
      } 
     } 
    } 
    return subTreeList; 
} 

使用范例:

String s = "2*-5+ sin(1.5*4)+(28- 3^4-(cos(3+(19*3)+1+(6/2))/2+tan(1+cos(1+9))-6/3+2.3*3.3345)+1)+1)-(4/2)"; 
System.out.println("cos: " + getBalancedStr(s, "cos", '(', ')', true)); 
// cos: [cos(3+(19*3)+1+(6/2)), cos(1+9)] 
System.out.println("sin: " + getBalancedStr(s, "sin", '(', ')', true)); 
// sin: [sin(1.5*4)] 
System.out.println("tan: " + getBalancedStr(s, "tan", '(', ')', true)); 
// tan: [tan(1+cos(1+9))] 

注意,这个方法编译正则表达式 - "(?=(\\b\\Q" + strBefore + markStart.toString() + "\\E.*))" - 将匹配cos或者只是作为一个完整的单词sin(因为\b是一个字的边界)和.*将匹配到行的末尾。如果您想要支持多行输入,请在前面使用(?s)"(?s)\\b\\Q" + strBefore + markStart.toString() + "\\E.*"。由于该模式位于未锚定的积极预测中的捕获组中,因此我们收集所有重叠匹配,并且每次匹配只会得到1个平衡子串(因为在找到相应的匹配结束分隔符后,我们跳出for循环。