2010-01-21 83 views
2

我在Antlr语法中有一个左递归问题。虽然我认为我明白为什么出现问题,我无法想出解决方案。问题在于我的数据类型规则的最后一行。我已经包括了整个语法给你看:Antlr左递归问题

grammar Test; 

options {output=AST;ASTLabelType=CommonTree;} 
tokens {FUNCTION; ATTRIBUTES; CHILDREN; COMPOSITE;} 

program  : function ; 
function : ID (OPEN_BRACKET (attribute (COMMA? attribute)*)? CLOSE_BRACKET)? (OPEN_BRACE function* CLOSE_BRACE)? SEMICOLON? -> ^(FUNCTION ID ^(ATTRIBUTES attribute*) ^(CHILDREN function*)) ; 

attribute : ID (COLON | EQUALS) datatype -> ^(ID datatype); 

datatype : ID  -> ^(STRING["id"] ID) 
      | NUMBER -> ^(STRING["number"] NUMBER) 
      | STRING -> ^(STRING["string"] STRING) 
      | BOOLEAN -> ^(STRING["boolean"] BOOLEAN) 
      | array -> ^(STRING["array"] array) 
      | lookup -> ^(STRING["lookup"] lookup) 
      | datatype PLUS datatype -> ^(COMPOSITE datatype datatype) ; 

array  : OPEN_BOX (datatype (COMMA datatype)*)? CLOSE_BOX -> datatype* ; 
lookup  : OPEN_BRACE (ID (PERIOD ID)*) CLOSE_BRACE -> ID* ; 

NUMBER 
    : ('+' | '-')? (INTEGER | FLOAT) 
    ; 

STRING 
    : '"' (ESC_SEQ | ~('\\'|'"'))* '"' 
    ; 

BOOLEAN 
    : 'true' | 'TRUE' | 'false' | 'FALSE' 
    ; 

ID : (LETTER|'_') (LETTER | INTEGER |'_')* 
    ; 

COMMENT 
    : '//' ~('\n'|'\r')* '\r'? '\n' {$channel=HIDDEN;} 
    | '/*' (options {greedy=false;} : .)* '*/' {$channel=HIDDEN;} 
    ; 

WHITESPACE : (' ' | '\t' | '\r' | '\n') {$channel=HIDDEN;} ; 

COLON : ':' ; 
SEMICOLON : ';' ; 

COMMA : ',' ; 
PERIOD : '.' ; 
PLUS : '+' ; 
EQUALS : '=' ; 

OPEN_BRACKET : '(' ; 
CLOSE_BRACKET : ')' ; 

OPEN_BRACE : '{' ; 
CLOSE_BRACE : '}' ; 

OPEN_BOX : '[' ; 
CLOSE_BOX : ']' ; 

fragment 
LETTER 
    : 'a'..'z' | 'A'..'Z' 
    ; 

fragment 
INTEGER 
    : '0'..'9'+ 
    ; 

fragment 
FLOAT 
    : INTEGER+ '.' INTEGER* 
    ; 

fragment 
ESC_SEQ 
    : '\\' ('b'|'t'|'n'|'f'|'r'|'\"'|'\''|'\\') 
    ; 

我使用ANTLR的工作提供了一个函数来解决这个问题开发 - 但不幸的是它似乎没有工作:■

任何帮助很棒。

谢谢。

编辑:

这里是我想要实现语言的例子/解析

<FunctionName> <OptionalAttributes> <OptionalChildFunctions> 

因此,例如:

ForEach(in:[1,2,3,4,5] as:"i") { 
    Switch(value:{i}) { 
    Case(value:3) { 
     Print(message:"This is the number 3") 
    } 

    Default { 
     Print(message:"This isn't the number 3") 
    } 
} 
} 

回答

2

好吧,这应该做的伎俩:

grammar Test; 

/************************************** PARSER **************************************/ 
program 
    : function EOF 
    ; 

function 
    : ID (OPEN_PAREN (attribute (COMMA attribute)*)? CLOSE_PAREN)? 
     (OPEN_BRACE function* CLOSE_BRACE)? 
     SEMICOLON? 
    ; 

attribute 
    : ID (COLON | EQUALS)? expression 
    ; 

expression 
    : atom (PLUS atom)* 
    ; 

atom 
    : ID 
    | STRING 
    | BOOLEAN 
    | NUMBER 
    | array 
    | lookup 
    ; 

array 
    : OPEN_BOX (expression (COMMA expression)*)? CLOSE_BOX 
    ; 

lookup 
    : OPEN_BRACE (ID (PERIOD ID)*) CLOSE_BRACE 
    ; 

/************************************** LEXER **************************************/ 
NUMBER   : ('+' | '-')? (INTEGER | FLOAT) 
       ; 

STRING   : '"' (ESC_SEQ | ~('\\'|'"'))* '"' 
       ; 

BOOLEAN   : 'true' | 'TRUE' | 'false' | 'FALSE' 
       ; 

ID    : (LETTER|'_') (LETTER | INTEGER |'_')* 
       ; 

COMMENT   : '//' ~('\n'|'\r')* ('\r'? '\n'| EOF) {$channel=HIDDEN;} 
       | '/*' (options {greedy=false;} : .)* '*/' {$channel=HIDDEN;} 
       ; 

WHITESPACE  : (' ' | '\t' | '\r' | '\n') {$channel=HIDDEN;} ; 

COLON   : ':' ; 
SEMICOLON  : ';' ; 

COMMA   : ',' ; 
PERIOD   : '.' ; 
PLUS   : '+' ; 
EQUALS   : '=' ; 

OPEN_PAREN  : '(' ; 
CLOSE_PAREN  : ')' ; 

OPEN_BRACE  : '{' ; 
CLOSE_BRACE  : '}' ; 

OPEN_BOX  : '[' ; 
CLOSE_BOX  : ']' ; 

fragment 
LETTER   : 'a'..'z' | 'A'..'Z' ; 
fragment 
INTEGER   : '0'..'9'+ ; 
fragment 
FLOAT   : INTEGER+ '.' INTEGER* ; 
fragment 
ESC_SEQ   : '\\' ('b'|'t'|'n'|'f'|'r'|'\"'|'\''|'\\') ; 

请注意,我已将OPEN_BRACKETCLOSE_BRACKET的名称更改为OPEN_PARENCLOSE_PAREN。圆括号()是圆括号,方括号,[],被称为括号(称为方括号,但将它们称为方块并不会伤害IMO)。

+0

谢谢巴特。是的,你似乎已经钉了它!我应该从这里好起来!谢啦!非常感谢:) – 2010-01-23 15:26:59

+0

很高兴听到里奇,不客气。 – 2010-01-23 15:49:47