【问题标题】:how to find lexicographer id into WorNet's nt file without library如何在没有库的情况下在 WorNet 的 nt 文件中找到词典编纂者 ID
【发布时间】:2025-12-06 09:05:02
【问题描述】:

我正在尝试使用它们提供的文件将 VerbNet 与 WordNet 链接以直接处理数据:

动词网络 => http://verbs.colorado.edu/verb-index/vn/verbnet-3.3.tar.gz

WordNet => http://wordnet-rdf.princeton.edu/static/wordnet.nt.gz

VerbNet 中的动词通过其 sense_key 链接到 WordNet:

例如直播%2:31:00::

这将是 sense_key 的结构:

(引理)%(part_of_speech_number):(lexical_file_number):(lexicographer_id)::

解析nt文件的n个三元组,我找到了除了lexicographer_id之外的所有数据:

lemma => live 
part_of_speech_number => 2 
lexical_file_number => 31
lexicographer_id => ??

【问题讨论】:

    标签: wordnet n-triples


    【解决方案1】:

    解析 wordnet.nt 文件似乎没有为您提供此信息。

    如果从http://wordnetcode.princeton.edu/wn3.1.dict.tar.gzhttps://wordnet.princeton.edu/download/current-version 中的链接)下载 Wordnet 3.1 数据库,您将在那里找到包含以下条目的文件“index.sense”:

    bethel%1:06:00:: 02836245 1 0
    bethink%2:31:00:: 00685046 2 1
    bethink%2:39:00:: 02171205 1 3
    bethlehem%1:15:00:: 08813084 2 0
    

    目前对该结构的描述在https://wordnet.princeton.edu/documentation/senseidx5wn

    该行中的第一个参数是在 VerbNet 中使用的 sense_key。第二个参数是 synset_offset,它与文件 wordnet.nt 中的 Synset 标识符一致。

    从文件“index.sense”中,您还可以获得与结构“word.pos.sense_number”匹配的感觉编号,例如:“man.n.02”

    【讨论】:

      最近更新 更多