【问题标题】:How find "main" type for given topic in freebase RDF?如何在 freebase RDF 中找到给定主题的“主要”类型?
【发布时间】:2013-04-29 15:35:15
【问题描述】:


我需要在 RDF 文件中找到给定主题的“主要类型”。
当我在http://www.freebase.com 上的搜索框中输入问题时,自动完成程序会使用此“主要类型”为我提供主题名称。
例如:

  1. 当我写“Barack Oba”时,我可以看到“Barack Obama - 美国总统”。 主题“巴拉克奥巴马”有多种类型,但如何在 RDF 中找到 文件说少校是“美国总统”?
  2. 类似“伍迪艾伦”=>“编剧
  3. "EOS 400D" => "数码相机"

如何在 RDF 表示中找到这个“主要类型”?

感谢您的帮助。

【问题讨论】:

    标签: rdf freebase


    【解决方案1】:

    RDF 转储中尚未包含值得注意的类型。谷歌表示他们会,但没有提供时间表。

    【讨论】:

      【解决方案2】:

      大概您对“主要类型”的定义相当松散,即您不太担心确切的上下文匹配,只想要“最受欢迎”选项?

      假设您可以编写和运行 SPARQL 查询,执行此操作的最佳方法可能是运行一个查询,该查询为要自动完成的文本找到文本匹配,并找到与该文本相关联的最常用术语,例如

      SELECT ?term (COUNT(*) AS ?triples)
      {
        ?term ?property ?value .
        FILTER(REGEX(?value, "Barack Oba", "i"))
      } GROUP BY ?term ORDER BY DESC(?triples) LIMIT 1
      

      请注意,在此处使用 REGEX 会严重影响性能,根据底层 SPARQL 实现,可能有更有效的方法来执行这种文本搜索查询。

      【讨论】:

      • 嗨@RobV,感谢您的回复。但我需要别的东西。我使用来自developers.google.com/freebase/data 在文本表示中整个文件。我需要每个主题的“主要类型”信息。在旧格式中,四行是:/m/047b9p0/common/topic/notable_for {"types":[],"id":"/digicams/digital_camera","property":"/type/object / type", "name": "Digital Camera" } 其中 /m/047b9p0 是“Canon_EOS_1000D”的 ID,我的“主要类型”是“Digital Camera" 我在新的 RDF 格式中找不到此信息。
      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2015-04-01
      • 1970-01-01
      • 1970-01-01
      • 2020-11-23
      相关资源
      最近更新 更多