2010-01-25 53 views
3

Stackoverflow。Antrl3条件树重写

我的旅程ANTLR的持续(以前的问题可以提供更多的线索上我想要实现的!Q1 - How do I make a tree parserQ2 - Solving LL recursion problem)我已经打了又一个障碍,我不能flathom。

基本上(我相信)我的语法中的expression规则需要创建一个新的根节点,具体取决于它匹配的datatype的数量。我已经把一个例子来尝试最好的形容我的意思:

鉴于以下输入:

ComplexFunction(id="Test" args:[1, 25 + 9 + 8, true, [1,2,3]]) 

我得到这个树:

http://img25.imageshack.us/img25/2273/treeka.png

仅供参考 - 正确解析了“args”数组中的第一个元素。而数组“args”'25 + 9 + 8'中的第二个元素没有。它似乎只匹配表达式(9 + 8)的最后2个部分。

我试图让数组的第二个元素是一个EXPRESSION节点,与3个孩子25,9和8)。

我老实说卡住了,需要你的帮助(再次)。感谢您的时间:)

供参考,这是我的语法:

grammar Test; 

options {output=AST;ASTLabelType=CommonTree;} 
tokens {FUNCTION; NAME; ATTRIBUTES; ATTRIBUTE; VALUE; CHILDREN; EXPRESSION;} 

program : function ; 
function : ID (OPEN_BRACKET (attribute (COMMA? attribute)*)? CLOSE_BRACKET)? (OPEN_BRACE function* CLOSE_BRACE)? SEMICOLON? -> ^(FUNCTION ^(NAME ID) ^(ATTRIBUTES attribute*) ^(CHILDREN function*)) ; 

attribute : ID (COLON | EQUALS) expression -> ^(ATTRIBUTE ^(NAME ID) ^(VALUE expression)); 

expression : datatype (PLUS datatype)* -> datatype ^(EXPRESSION datatype+)?; 

datatype : ID -> ^(STRING["ID"] ID) 
    | NUMBER -> ^(STRING["NUMBER"] NUMBER) 
    | STRING -> ^(STRING["STRING"] STRING) 
    | BOOLEAN -> ^(STRING["BOOLEAN"] BOOLEAN) 
    | array -> ^(STRING["ARRAY"] array) 
    | lookup -> ^(STRING["LOOKUP"] lookup) ; 

array : OPEN_BOX (expression (COMMA expression)*)? CLOSE_BOX -> expression* ; 

lookup : OPEN_BRACE (ID (PERIOD ID)*) CLOSE_BRACE -> ID* ; 

NUMBER 
: ('+' | '-')? (INTEGER | FLOAT) 
; 

STRING 
    : '"' (ESC_SEQ | ~('\\'|'"'))* '"' 
    ; 

BOOLEAN 
: 'true' | 'TRUE' | 'false' | 'FALSE' 
; 

ID : (LETTER|'_') (LETTER | INTEGER |'_')* 
    ; 

COMMENT 
    : '//' ~('\n'|'\r')* '\r'? '\n' {$channel=HIDDEN;} 
    | '/*' (options {greedy=false;} : .)* '*/' {$channel=HIDDEN;} 
    ; 

WHITESPACE : (' ' | '\t' | '\r' | '\n') {$channel=HIDDEN;} ; 

COLON : ':' ; 
SEMICOLON : ';' ; 

COMMA : ',' ; 
PERIOD : '.' ; 
PLUS : '+' ; 
EQUALS : '=' ; 

OPEN_BRACKET : '(' ; 
CLOSE_BRACKET : ')' ; 

OPEN_BRACE : '{' ; 
CLOSE_BRACE : '}' ; 

OPEN_BOX : '[' ; 
CLOSE_BOX : ']' ; 

fragment 
LETTER 
: 'a'..'z' | 'A'..'Z' 
; 

fragment 
INTEGER 
: '0'..'9'+ 
; 

fragment 
FLOAT 
: INTEGER+ '.' INTEGER* 
; 

fragment 
ESC_SEQ 
    : '\\' ('b'|'t'|'n'|'f'|'r'|'\"'|'\''|'\\') 
    ; 
+0

任何人都? :( – 2010-01-25 23:00:20

回答

0

哈哈!我想我明白了!如果其他人有类似的问题,看看我的新语法:

grammar Test; 

options {output=AST;ASTLabelType=CommonTree;} 
tokens {FUNCTION; ATTRIBUTES; ATTRIBUTE; VALUE; CHILDREN; EXPRESSION;} 

@parser::members { int dataTypeCount = 0; } 

program  : function ; 
function : ID (OPEN_BRACKET (attribute (COMMA? attribute)*)? CLOSE_BRACKET)? (OPEN_BRACE function* CLOSE_BRACE)? SEMICOLON? -> ^(FUNCTION ^(ID["ID"] ID) ^(ATTRIBUTES attribute*) ^(CHILDREN function*)) ; 

attribute : ID (COLON | EQUALS) expression -> ^(ATTRIBUTE ^(ID["ID"] ID) ^(VALUE expression)); 

expression : datatype {dataTypeCount = 1;} (PLUS datatype {dataTypeCount++;})* 
       -> {dataTypeCount == 1}? datatype* 
       -> ^(EXPRESSION datatype*) ;  

datatype : ID  -> ^(STRING["ID"] ID) 
      | NUMBER -> ^(STRING["NUMBER"] NUMBER) 
      | STRING -> ^(STRING["STRING"] STRING) 
      | BOOLEAN -> ^(STRING["BOOLEAN"] BOOLEAN) 
      | array -> ^(STRING["ARRAY"] array) 
      | lookup -> ^(STRING["LOOKUP"] lookup) ; 

array  : OPEN_BOX (expression (COMMA expression)*)? CLOSE_BOX -> expression* ; 

lookup  : OPEN_BRACE (ID (PERIOD ID)*) CLOSE_BRACE -> ID* ; 

NUMBER 
    : ('+' | '-')? (INTEGER | FLOAT) 
    ; 

STRING 
    : '"' (ESC_SEQ | ~('\\'|'"'))* '"' 
    ; 

BOOLEAN 
    : 'true' | 'TRUE' | 'false' | 'FALSE' 
    ; 

ID : (LETTER|'_') (LETTER | INTEGER |'_')* 
    ; 

COMMENT 
    : '//' ~('\n'|'\r')* '\r'? '\n' {$channel=HIDDEN;} 
    | '/*' (options {greedy=false;} : .)* '*/' {$channel=HIDDEN;} 
    ; 

WHITESPACE : (' ' | '\t' | '\r' | '\n') {$channel=HIDDEN;} ; 

COLON : ':' ; 
SEMICOLON : ';' ; 

COMMA : ',' ; 
PERIOD : '.' ; 
PLUS : '+' ; 
EQUALS : '=' ; 

OPEN_BRACKET : '(' ; 
CLOSE_BRACKET : ')' ; 

OPEN_BRACE : '{' ; 
CLOSE_BRACE : '}' ; 

OPEN_BOX : '[' ; 
CLOSE_BOX : ']' ; 

fragment 
LETTER 
    : 'a'..'z' | 'A'..'Z' 
    ; 

fragment 
INTEGER 
    : '0'..'9'+ 
    ; 

fragment 
FLOAT 
    : INTEGER+ '.' INTEGER* 
    ; 

fragment 
ESC_SEQ 
    : '\\' ('b'|'t'|'n'|'f'|'r'|'\"'|'\''|'\\') 
    ;