【问题标题】:Wordnet (Word Sense Annotated) CorpusWordnet (Word Sense Annotated) 语料库
【发布时间】:2012-02-08 00:20:12
【问题描述】:

我一直在使用许多不同的语料库进行自然语言处理,并且一直在寻找一个使用 Wordnet Word Senses 注释的语料库。

我知道可能没有包含此信息的大型语料库,因为语料库需要手动构建,但必须有一些东西可以完成。

此外,如果不存在语料库,是否至少有一个带有语义注释的 ngram 数据库(单词是其每个定义的时间百分比,或每个 wordnet 定义的数字计数,具体取决于常见程度词义是)?

【问题讨论】:

    标签: nlp wordnet corpus tagged-corpus


    【解决方案1】:

    为 WordNet 注释的三个突出语料库:

    【讨论】:

    • SemCor 是迄今为止所有链接中最好的。看起来现在没有很多高质量的 WordNet 注释语料库可用。
    • @cardine 和 cyborg,很抱歉发表评论,但我找不到您的联系信息。你能给我发电子邮件到 info@panabee.com 吗?根据您对 NLP 的兴趣,我有一个您可能感兴趣的小项目。谢谢。
    【解决方案2】:

    部分SENSEVAL(现为SEMEVAL)数据使用WordNet 进行注释。

    【讨论】:

      【解决方案3】:

      你可以使用 senseval2,对于 java 有一个 semcor 格式和 (jSemcor API) 还有 senseval3。 这两个语料库用于词义消歧。

      【讨论】:

        猜你喜欢
        • 2023-04-04
        • 2012-12-07
        • 2021-10-03
        • 1970-01-01
        • 2015-08-20
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多