【发布时间】:2015-07-23 23:51:41
【问题描述】:
我有两个包含标题和其他信息的数据集,但在数据集 A 中我有标题,在数据集 B 中我有标题和 URL。
我必须将 URL 从数据集 B 放入数据集 A。有些标题在 A 和 B 中相同,有些则不同,有些则略有不同(问题来了)。
所以我需要同时合并和聚类那些相似的。我知道我可以与 DBpedia 协调,但我需要的是在两个数据集之间“协调”。 有没有可能?
谢谢。
【问题讨论】:
标签: cluster-analysis openrefine