【发布时间】:2014-03-02 00:11:33
【问题描述】:
使用 ANTLR 4.2,我正在尝试对此测试数据进行非常简单的解析:
RRV0#ABC
使用最小语法:
grammar Tiny;
thing : RRV N HASH ID ;
RRV : 'RRV' ;
N : [0-9]+ ;
HASH : '#' ;
ID : [a-zA-Z0-9]+ ;
WS : [\t\r\n]+ -> skip ; // match 1-or-more whitespace but discard
根据 Terence Parr 的 Definitive ANTLR 4 reference 以下摘录,我希望词法分析器 RRV 在 ID 之前匹配:
BEGIN : 'begin' ; // match b-e-g-i-n sequence; ambiguity resolves to BEGIN
ID : [a-z]+ ; // match one or more of any lowercase letter
用上面的测试数据运行ANTLR4测试台,输出为
[@0,0:3='RRV0',<4>,1:0]
[@1,4:4='#',<3>,1:4]
[@2,5:7='ABC',<4>,1:5]
[@3,10:9='<EOF>',<-1>,2:0]
line 1:0 mismatched input 'RRV0' expecting 'RRV'
我可以看到 ID 的第一个标记是 ,值为 'RRV0'
我尝试重新排列词法分析器项目的顺序。我还尝试通过在语法规则中显式匹配(而不是通过显式词法分析器项目)来使用隐式词法分析器项目。我也尝试使匹配不贪心。这些对我来说并不成功。
如果我将 lexed ID 项目更改为不匹配大写,那么 RRV 项目确实匹配并且解析会更进一步。
我从 ANTLR 4.1 开始时遇到了同样的问题。
我在 ANTLRWorks 和命令行中进行了检查,两种方式的结果都相同。
如何更改语法以匹配词法分析器项目 RRV 而不是 ID?
【问题讨论】:
标签: antlr4