【发布时间】:2013-01-13 01:14:26
【问题描述】:
如果您使用 Freebase 搜索按名称获取任何实体的匹配项,您将获得按 relevance score 排序的结果。例如Taj Mahal。
我正在尝试使用 Freebase 数据转储获得类似的结果,因此在我的数据库中,与“泰姬陵”相关的主题将按相关性排序,即首先是建筑,其次是音乐家,依此类推。
是否有任何建议如何在不查询 Freebase 搜索 API 的情况下实现这一目标?
【问题讨论】:
如果您使用 Freebase 搜索按名称获取任何实体的匹配项,您将获得按 relevance score 排序的结果。例如Taj Mahal。
我正在尝试使用 Freebase 数据转储获得类似的结果,因此在我的数据库中,与“泰姬陵”相关的主题将按相关性排序,即首先是建筑,其次是音乐家,依此类推。
是否有任何建议如何在不查询 Freebase 搜索 API 的情况下实现这一目标?
【问题讨论】:
您链接到的有关相关性分数的 wiki 页面说:
Freebase 实体具有在索引期间计算的固有相关性分数(排名),该分数是其在 Freebase 和 Wikipedia 中的入站和出站链接计数的函数。一些流行的 Freebase 实体也有一个由谷歌计算的流行度分数。默认情况下,两个分数在查询期间会合并在一起。
这应该让您很好地了解从哪里开始。 Freebase 入度和出度可以直接从转储中计算,但 Wikipedia 入/出度需要使用 Wikipedia 转储(或 Freebase 的 WEX 转储)。 “谷歌计算的人气分数”显然是你无法复制的。
【讨论】: