ANTLR3 词法分析器优先级答案

【问题标题】：ANTLR3 lexer precedenceANTLR3 词法分析器优先级
【发布时间】：2010-10-15 12:28:15
【问题描述】：

我想在 ANTLR3 词法分析器中从 '..' 创建一个令牌，用于将表达式串在一起

a..b     // [1]
c .. x   // [2]
1..2     // [3] 
3 .. 4   // [4]

所以，我添加了，

DOTDOTSEP : '..' 
          ;

问题是我已经有规则了：

FLOAT : INT (('.' INT (('e'|'E') INT)? 'f'?) | (('e'|'E') INT)? ('f'))
      ;

在上面的示例 [3] 中，1..2 被匹配为 FLOAT（我不知道为什么因为跟随第一个 . 是另一个 . 不是一个 INT，但它是）。

我想知道是否有办法更改词法分析器规则的优先级，以便首先匹配DOTDOTSEP，然后匹配FLOAT。

看着here，我似乎输给了"The rule having the greatest count is the winner.",，但想知道是否有办法绕过它。

附： INT 定义如下...

fragment DIGIT
    : '0'..'9'
    ;

INT : DIGIT+
    ;

编辑。 进一步的测试让我觉得它并不像直接匹配FLOAT 规则那么简单。（我本来打算改变这个问题，但既然我现在有了答案，我就不会了。）问题（我相信）仍然在于词法分析器规则的优先级，所以问题仍然保持不变。

【问题讨论】：

标签： antlr lexer antlr3

【解决方案1】：

你看http://sds.sourceforge.net/src/antlr/doc/lexer.html了吗？

一种可能的解决方案是定义以下内容：

fragment
INT : DIGIT+
    ;

fragment
RANGE : INT DOTDOTSEP INT
      ;

fragment
FLOAT : INT (('.' INT (('e'|'E') INT)? 'f'?) | (('e'|'E') INT)? ('f'))
      ;

NUMBER
    : (INT '.') => FLOAT       { $type=FLOAT; }
    | (INT DOTDOTSEP) => RANGE { $type=RANGE; }
    | INT                      { $type=INT; }
    ;

【讨论】：

这让我更接近了，只是需要进行更多调整。我没有找到的链接，但它看起来很棒；正是我应该读的那种东西，所以我现在就去做。谢谢。
我现在做得很好，只是给其他可能会来的人做两件事。在 ANTLRWorks v1.4 中，解释器无法处理谓词，因此在没有谓词时看起来会出现错误（这让我慢了一点），而且我不得不将 $settype(TYPE); 更改为 $type=TYPE;
@tjm，我稍微编辑了 ANTLR 示例。现在是否兼容 v3？
@Bart。我注意到您的编辑，谢谢他们很有帮助。据我所知 is 现在 v3 兼容。至少我可以肯定地说，“它在这里工作得很好！（TM）”:)