2008-09-26 74 views
5

什么是最简单(最短,最少规则,没有警告)的方式来解析同一语法中的有效日期和数字?我的问题是,匹配有效月份(1-12)的词法分析规则将匹配任何1-12的匹配项。所以,如果我只是想匹配一个数字,我需要一个像解析规则:Antlr:最简单的方法来识别日期和数字?

number: (MONTH|INT); 

它只有当我添加词法规则一天和一年变得更加复杂。我想这样的日期解析规则:

date: month '/' day ('/' year)? -> ^('DATE' year month day); 

我不在乎月,日&年是解析或词法规则,只是只要我结束了同一个树形结构。我还需要能够在其他地方认识数字,例如:

foo: STRING OP number -> ^(OP STRING number); 
STRING: ('a'..'z')+; 
OP: ('<'|'>'); 

回答

5

的问题是,你似乎想在你的词法分析器和/或解析器执行两个句法和语义检查。这是一个常见的错误,只有在非常简单的语言中才有可能。

你真正需要做的是更广泛地接受词法分析器和解析器,然后执行语义检查。取决于你是否需要在每个月的日子之前接受零:1)真正接受你的INT,2)将DATENUM定义为只接受那些有效天数的令牌,但不接受有效的INT。我推荐第二种方法,因为代码稍后会需要较少的语义检查(因为INT会在语法级别进行验证,并且您只需对日期执行语义检查。第一种方法:

INT: '0'..'9'+; 

第二种方法:

DATENUM: '0' '1'..'9'; 
INT: '0' | SIGN? '1'..'9' '0'..'9'*; 

使用的词法规则接受邀请后,您的日期字段将之一:

date: INT '/' INT ('/' INT)? 

或:

date: (INT | DATENUM) '/' (INT | DATENUM) ('/' (INT | DATENUM))? 

之后,你会执行语义运行你的AST,以确保你的日期是有效的。

如果你在你的语法进行语义检查死心塌地,然而,ANTLR允许解析器语义断言,所以你可以做一个检查这样的值的日期字段:

date: month=INT '/' day=INT (year='/' INT)? { year==null ? (/* First check /*) : (/* Second check */)} 

当你这样做,但是,你是在语法中嵌入语言特定的代码,并且它不能跨目标移植。

0

使用ANTLR4,这里是我使用的一个简单的组合语法。它使用词法分析器仅匹配简单的标记,而使解析器规则解释日期与数字。

// parser rules 

date 
    : INT SEPARATOR month SEPARATOR INT 
    | INT SEPARATOR month SEPARATOR INT4 
    | INT SEPARATOR INT SEPARATOR INT4; 

month : JAN | FEB | MAR | APR | MAY | JUN | JUL | AUG | SEP | OCT | NOV | DEC ; 

number : FLOAT | INT | INT4 ; 

// lexer rules 

FLOAT : DIGIT+ '.' DIGIT+ ; 

INT4 : DIGIT DIGIT DIGIT DIGIT; 
INT : DIGIT+; 

JAN : [Jj][Aa][Nn] ; 
FEB : [Ff][Ee][Bb] ; 
MAR : [Mm][Aa][Rr] ; 
APR : [Aa][Pp][Rr] ; 
MAY : [Mm][Aa][Yy] ; 
JUN : [Jj][Uu][Nn] ; 
JUL : [Jj][Uu][Ll] ; 
AUG : [Aa][Uu][Gg] ; 
SEP : [Ss][Ee][Pp] ; 
OCT : [Oo][Cc][Tt] ; 
NOV : [Nn][Oo][Vv] ; 
DEC : [Dd][Ee][Cc] ; 

SEPARATOR : [/\\\-] ; 

fragment DIGIT : [0-9];