【问题标题】:Issue to combine the Clueweb09 annotation data and Freebase dump data合并 Clueweb09 注释数据和 Freebase 转储数据的问题
【发布时间】:2015-06-03 18:47:36
【问题描述】:

我正在使用Freebase dump data 来使用RDF 并将其与annotation ClueWeb09 data 结合使用。但是,我面临以下问题:

clueweb09-en0000-00-00011 ISO-8859-1 英语 17964 17980 0.999813 0.000165 /m/02h40lc

但是,当我使用(Java 和 Ubuntu)读取 Freebase 转储数据时,当我读取 gz 文件时会提到 /m.02h40lc。我想知道我做错了什么,或者我应该手动将 /m.02h40lc 更改为 /m/02h40lc

【问题讨论】:

    标签: freebase


    【解决方案1】:

    是的,在处理当前数据转储时,您需要将标识符中的所有斜杠 (/) 替换为句点 (.)。这种转换对于使包含标识符的 URI 正常工作是必要的。这不仅适用于 MID,也适用于用于类型、命名空间等的其他标识符。例如,type/object/name 在数据转储中变为 type.object.name。

    【讨论】:

      猜你喜欢
      • 2017-10-27
      • 1970-01-01
      • 2023-02-06
      • 1970-01-01
      • 2013-01-13
      • 2018-08-12
      • 1970-01-01
      • 1970-01-01
      • 2013-05-11
      相关资源
      最近更新 更多