【问题标题】:ANTLR3 lexer precedenceANTLR3 词法分析器优先级
【发布时间】:2010-10-15 12:28:15
【问题描述】:

我想在 ANTLR3 词法分析器中从 '..' 创建一个令牌,用于将表达式串在一起

a..b     // [1]
c .. x   // [2]
1..2     // [3] 
3 .. 4   // [4]

所以,我添加了,

DOTDOTSEP : '..' 
          ;

问题是我已经有规则了:

FLOAT : INT (('.' INT (('e'|'E') INT)? 'f'?) | (('e'|'E') INT)? ('f'))
      ;

在上面的示例 [3] 中,1..2 被匹配为 FLOAT(我不知道为什么因为跟随第一个 . 是另一个 . 不是一个 INT,但它是)。

我想知道是否有办法更改词法分析器规则的优先级,以便首先匹配DOTDOTSEP,然后匹配FLOAT

看着here,我似乎输给了"The rule having the greatest count is the winner.",,但想知道是否有办法绕过它。

附: INT 定义如下...

fragment DIGIT
    : '0'..'9'
    ;

INT : DIGIT+
    ;

编辑。 进一步的测试让我觉得它并不像直接匹配FLOAT 规则那么简单。 (我本来打算改变这个问题,但既然我现在有了答案,我就不会了。)问题(我相信)仍然在于词法分析器规则的优先级,所以问题仍然保持不变。

【问题讨论】:

    标签: antlr lexer antlr3


    【解决方案1】:

    你看http://sds.sourceforge.net/src/antlr/doc/lexer.html了吗?

    一种可能的解决方案是定义以下内容:

    fragment
    INT : DIGIT+
        ;
    
    fragment
    RANGE : INT DOTDOTSEP INT
          ;
    
    fragment
    FLOAT : INT (('.' INT (('e'|'E') INT)? 'f'?) | (('e'|'E') INT)? ('f'))
          ;
    
    NUMBER
        : (INT '.') => FLOAT       { $type=FLOAT; }
        | (INT DOTDOTSEP) => RANGE { $type=RANGE; }
        | INT                      { $type=INT; }
        ;
    

    【讨论】:

    • 这让我更接近了,只是需要进行更多调整。我没有找到的链接,但它看起来很棒;正是我应该读的那种东西,所以我现在就去做。谢谢。
    • 我现在做得很好,只是给其他可能会来的人做两件事。在 ANTLRWorks v1.4 中,解释器无法处理谓词,因此在没有谓词时看起来会出现错误(这让我慢了一点),而且我不得不将 $settype(TYPE); 更改为 $type=TYPE;
    • @tjm,我稍微编辑了 ANTLR 示例。现在是否兼容 v3?
    • @Bart。我注意到您的编辑,谢谢他们很有帮助。据我所知 is 现在 v3 兼容。至少我可以肯定地说,“它在这里工作得很好!(TM)”:)
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2015-01-29
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2018-04-12
    • 1970-01-01
    相关资源
    最近更新 更多