在a previous question with a simple grammar中,我学会了处理可包含关键字列表中关键字的ID。我的实际语法稍微复杂一些:在不同类型的句子中有几个关键字列表。这是我的一个简单的语法尝试,告诉的故事:来自ANTLR4中列表的令牌的非贪婪匹配
grammar Hello;
file : (fixedSentence)* EOF ;
sentence : KEYWORD1 ID+ KEYWORD2 ID+ PERIOD
| KEYWORD3 ID+ KEYWORD4 ID+ PERIOD;
KEYWORD1 : 'hello' | 'howdy' | 'hi' ;
KEYWORD2 : 'bye' | 'goodbye' | 'adios' ;
KEYWORD3 : 'dear' | 'dearest' ;
KEYWORD4 : 'love' | 'yours' ;
PERIOD : '.' ;
ID : [a-z]+ ;
WS : [ \t\r\n]+ -> skip ;
所以我想匹配的句子,例如:
hello snickers bar goodbye mars bar.
dear peter this is fun yours james.
和伟大工程。但我也想匹配包含关键字的句子,这些关键词不会被期望终止ID +块。例如
hello hello kitty goodbye my dearest raggedy ann and andy.
hello
拳头显示为KEYWORD1
,然后只是以下作为第一ID +的一部分。以上链接问题的例子,我可以修复它是这样的:
// ugly solution:
fixedSentence : KEYWORD1 a=(ID|KEYWORD1|KEYWORD3|KEYWORD4)+ KEYWORD2 b=(ID|KEYWORD1|KEYWORD2|KEYWORD3|KEYWORD4)+ PERIOD
| KEYWORD3 a=(ID|KEYWORD1|KEYWORD2|KEYWORD3)+ KEYWORD4 b=(ID|KEYWORD1|KEYWORD2|KEYWORD3|KEYWORD4)+ PERIOD;
它的工作原理和做我想做的。在我的真实语言中,我有数百个关键字列表,可用于不同类型的句子,所以如果我尝试这种方法,我肯定会犯这样一个错误,并且当我用我的语言创建新结构时,我必须回去编辑所有其他的。
在ANTLR4书的评论示例之后,最好是从列表中进行非贪婪匹配。所以,我想这个
// non-greedy matching concept:
KEYWORD : KEYWORD1 | KEYWORD2 | KEYWORD3 | KEYWORD4 ;
niceID : (ID | KEYWORD) ;
niceSentence : KEYWORD1 niceID+? KEYWORD2 niceID+? PERIOD
| KEYWORD2 niceID+? KEYWORD3 niceID+? PERIOD;
,我认为如下征求意见模型(例如,在本书的第81页给出):
COMMENT : '/*' .*? '*/' -> skip ;
使用?
建议非贪婪。 (尽管这个例子是一个词法分析规则,这是否改变了这里的含义?)fixedSentence
工作但niceSentence
是失败的。我从哪里出发?
具体而言,在上述分析的Hello Kitty的测试句子报告的错误是,
测试规则sentence
:
line 1:6 extraneous input 'hello' expecting ID
line 1:29 extraneous input 'dearest' expecting {'.', ID}
测试治fixedSentence
:没有错误。
测试规则niceSentence
:
line 1:6 extraneous input 'hello' expecting {ID, KEYWORD}
line 1:29 extraneous input 'dearest' expecting {KEYWORD2, ID, KEYWORD}
line 1:57 extraneous input '.' expecting {KEYWORD2, ID, KEYWORD}
如果它有助于看到分析树,here they are。
感谢您在这里的洞察。也感谢斯坦福大学CoreNLP的链接,我将更多地学习(尽管我正在解决一个不同的更简单的问题,我希望)。与此同时,为什么我可以做一个像'/ */* * /'这样的注释,这看起来很像我想要的。第一次使用标记'/ *'作为“关键字”,第二次使用某些内容,并且'。*?'不会占用最后的'* /' - 所有这些都是行为我想要。有没有办法让这个机制适应我的问题? – Stacky
“niceSentence”的错误信息是什么?你测试了什么输入字符串? – GRosenberg
我将错误和解析树添加到原始问题的底部。另外,作为一个实验,我尝试使用niceSentence和niceID作为词法规则,这可能很愚蠢,但我认为它会使它更接近评论示例。那里没有快乐。你能理解这里发生了什么吗?在这些错误的帮助下? – Stacky