【问题标题】:Parser output divergence for almost identical sentences-- why?几乎相同句子的解析器输出差异——为什么?
【发布时间】:2016-07-31 15:43:39
【问题描述】:

当我通过 TreeAnnotation 运行这两个几乎相同的句子时,为什么会得到如此不同的解析树?第一个正确返回“SQ(VBZ 做)..)”模式,但第二个显示“S(NP(NNP 做)...”。这是一个错误吗?谢谢。

  1. 他有时间吗? (ROOT (SQ (VBZ Does) (NP (PRP he)) (VP (VB have) (NP (NN time))) (.?)))

  2. 约翰有时间吗? (ROOT (S (NP (NNP Does) (NNP John)) (VP (VBP have) (NP (NN time))) (.?)))

【问题讨论】:

    标签: stanford-nlp


    【解决方案1】:

    可爱——这看起来像一个 POS 标记错误。在第一种情况下,“Does”被正确标记为 VBZ;第二,它被错误地标记为专有名词(NNP)。很可能,这是 POS 标记器中的序列模型搞砸了:由于“Does”和“John”都是大写的,因此它更喜欢将它们都标记为专有名词。

    【讨论】:

    • 确实如此——如果我将“Does”更改为“does”,那么我会得到 VBZ.... 有趣。我想这对雌鹿来说很令人困惑。
    • 但是,这是一个谜:第一个字母是否大写:“安排约会”给出(ROOT(NP(NP(NN计划))(NP(DT an)(NN约会))) ),而“安排约会”产生 (ROOT (S (VP (VB Schedule) (NP (DT an) (NN约会)))))。我希望在这两种情况下都有相同的输出。
    猜你喜欢
    • 1970-01-01
    • 2012-01-20
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-04-21
    • 2023-03-09
    • 1970-01-01
    相关资源
    最近更新 更多