【问题标题】:When to use graph databases, ontologies, and knowledge graphs何时使用图数据库、本体和知识图
【发布时间】:2021-09-24 14:40:12
【问题描述】:

我一直在努力理解这些技术何时从实际角度有用,以及它们之间有何不同。专家可以检查我的理解吗?

  1. 图形数据库:当关系复杂、继承、以不同程度的置信度推断并且可能发生变化时,这些数据库比关系数据库更容易理解和管理。一些例子:用户不知道他们在层次结构中需要多少深度;从社交媒体推断关系,对 ID 解析、主题解析和关系强度有不同程度的信心;或者不知道他们想要存储什么样的呼叫中心数据;所有这些可以存储在关系数据库中,但它们需要不断更新。它们对于某些任务也更有执行力。

  2. 本体:这些正式和标准化的知识表示用于打破数据孤岛。例如,假设一家 B2B 销售公司的收入来自多个不同的业务线,包括一次性付款、订阅、IP 销售和咨询服务。收入数据存储在许多具有许多特性的不同数据库中。本体允许用户将“客户付款”定义为“创造或返还收入”的任何事物,以便主题专家可以在他们的数据库中适当地标记付款。本体可以与图数据库或关系数据库一起使用,但对类继承的强调使得它们更容易在图数据库中实现,其中类的分类可以很容易地建模。

  3. 知识图:知识图是一个图数据库,其中语言(含义、实体和节点分类)由本体管理。因此,在我们的 B2B 示例中,“客户支付”边缘具有一次性支付、订阅等子类型,并将“客户”类连接到“业务线”类。

基本正确吗?

【问题讨论】:

  • 听起来基本正确。

标签: graph-databases ontology knowledge-graph


【解决方案1】:

graph database(GD)是一个可以存储图数据的数据库,它主要有三种元素:节点、边和属性。两种流行的图数据库类型是(1)基于资源描述框架(RDF)的图数据库,例如。基于 Blazegraph 和 (2) 标签传播图 (LPG) 的图数据库,例如。新4j。 RDF 以主语、动词和宾语 (SVO) 三元组的形式表示知识,例如 John livesIn London,并作为其节点和边不能保存属性,需要添加额外的节点或文字来表示属性。 LPG 以边、节点和属性的形式表示知识,其中节点和边可以以键:值的形式保存属性。例如,一个节点可以有标签 Person,而 Person 可以有属性 name:Tom Hanks,born:1956。

ontology 是对概念及其关系的描述,使用概念的实例、实例(和类)的属性、类的限制和规则(if-then 语句)。这些规则描述了可以从构成本体描述的整体理论的断言/公理中得出的逻辑推论。上层本体(例如DOLCE)描述一般概念和关系,而领域本体(例如Gene Ontology)描述特定领域中的概念和关系。图数据库可能在其模式级别有一个本体,用于逻辑一致性检查。

通常,knowledge graph (KG) 是将知识库组织为具有节点和节点之间链接的图。早期 KG 的一个示例是 Wordnet,它捕获单词及其含义之间的语义关系。后来谷歌在DBpediaFreebase的基础上开发了他们的谷歌知识图(GKG),使用从索引网页中提取的RDFa、微数据和JSON-LD内容,并使用schema.org词汇来组织节点。谷歌报告说它在 GKG 中拥有大约 700 亿个事实。

图数据库支持查询,但不支持需要本体的逻辑推理。如果数据中的连接是主要关注点(例如朋友的朋友),检索比存储更重要,并且数据模型经常更改,那么图形数据库将是一个很好的选择。

本体用于我们需要从给定的知识中推断出新知识。例如,如果给定 (1) 苏格拉底是人,(2) 所有人都是凡人,那么本体中的推理机或推理机可以推断出新知识 (3) 苏格拉底是凡人。这是通过 Web Ontology Language (OWL) 用来描述资源的描述逻辑公理实现的。 OWL 使用资源描述框架 (RDF) 进行序列化。

本体也用于我们需要检查数据模型的一致性。例如,如果一个公理说 Human 和 Sponge 是不相交的类,而我们让 John(人类)实例同时包含 Human 和 Sponge 类,那么一致性测试将失败。

分类法是构成本体主干的 IS-A 类层次结构。

知识图通常与基于标准 Web 技术(例如 HTTP、RDF、URIs 和 SPARQL)构建的链接开放数据 (LOD) 项目相关联。 KG 可以使用本体进行推理和图形数据库来存储知识。一些大型组织已经推出了他们的 KG。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2012-08-24
    • 1970-01-01
    • 2017-01-20
    • 1970-01-01
    • 2019-02-02
    • 2010-10-12
    相关资源
    最近更新 更多