array(2) { ["docs"]=> array(10) { [0]=> array(10) { ["id"]=> string(3) "428" ["text"]=> string(77) "Visual Studio 2017 单独启动MSDN帮助(Microsoft Help Viewer)的方法" ["intro"]=> string(288) "目录 ECharts 异步加载 ECharts 数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具,而是在交互、性能、数据处理等方面有更高的要求。 chart.setOption({ color: [ " ["username"]=> string(8) "DonetRen" ["tagsname"]=> string(55) "Visual Studio 2017|MSDN帮助|C#程序|.NET|Help Viewer" ["tagsid"]=> string(23) "[401,402,403,"300",404]" ["catesname"]=> string(0) "" ["catesid"]=> string(2) "[]" ["createtime"]=> string(10) "1511400964" ["_id"]=> string(3) "428" } [1]=> array(10) { ["id"]=> string(3) "427" ["text"]=> string(42) "npm -v;报错 cannot find module "wrapp"" ["intro"]=> string(288) "目录 ECharts 异步加载 ECharts 数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具,而是在交互、性能、数据处理等方面有更高的要求。 chart.setOption({ color: [ " ["username"]=> string(4) "zzty" ["tagsname"]=> string(50) "node.js|npm|cannot find module "wrapp“|node" ["tagsid"]=> string(19) "[398,"239",399,400]" ["catesname"]=> string(0) "" ["catesid"]=> string(2) "[]" ["createtime"]=> string(10) "1511400760" ["_id"]=> string(3) "427" } [2]=> array(10) { ["id"]=> string(3) "426" ["text"]=> string(54) "说说css中pt、px、em、rem都扮演了什么角色" ["intro"]=> string(288) "目录 ECharts 异步加载 ECharts 数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具,而是在交互、性能、数据处理等方面有更高的要求。 chart.setOption({ color: [ " ["username"]=> string(12) "zhengqiaoyin" ["tagsname"]=> string(0) "" ["tagsid"]=> string(2) "[]" ["catesname"]=> string(0) "" ["catesid"]=> string(2) "[]" ["createtime"]=> string(10) "1511400640" ["_id"]=> string(3) "426" } [3]=> array(10) { ["id"]=> string(3) "425" ["text"]=> string(83) "深入学习JS执行--创建执行上下文(变量对象,作用域链,this)" ["intro"]=> string(288) "目录 ECharts 异步加载 ECharts 数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具,而是在交互、性能、数据处理等方面有更高的要求。 chart.setOption({ color: [ " ["username"]=> string(7) "Ry-yuan" ["tagsname"]=> string(33) "Javascript|Javascript执行过程" ["tagsid"]=> string(13) "["169","191"]" ["catesname"]=> string(0) "" ["catesid"]=> string(2) "[]" ["createtime"]=> string(10) "1511399901" ["_id"]=> string(3) "425" } [4]=> array(10) { ["id"]=> string(3) "424" ["text"]=> string(30) "C# 排序技术研究与对比" ["intro"]=> string(288) "目录 ECharts 异步加载 ECharts 数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具,而是在交互、性能、数据处理等方面有更高的要求。 chart.setOption({ color: [ " ["username"]=> string(9) "vveiliang" ["tagsname"]=> string(0) "" ["tagsid"]=> string(2) "[]" ["catesname"]=> string(8) ".Net Dev" ["catesid"]=> string(5) "[199]" ["createtime"]=> string(10) "1511399150" ["_id"]=> string(3) "424" } [5]=> array(10) { ["id"]=> string(3) "423" ["text"]=> string(72) "【算法】小白的算法笔记:快速排序算法的编码和优化" ["intro"]=> string(288) "目录 ECharts 异步加载 ECharts 数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具,而是在交互、性能、数据处理等方面有更高的要求。 chart.setOption({ color: [ " ["username"]=> string(9) "penghuwan" ["tagsname"]=> string(6) "算法" ["tagsid"]=> string(7) "["344"]" ["catesname"]=> string(0) "" ["catesid"]=> string(2) "[]" ["createtime"]=> string(10) "1511398109" ["_id"]=> string(3) "423" } [6]=> array(10) { ["id"]=> string(3) "422" ["text"]=> string(64) "JavaScript数据可视化编程学习(二)Flotr2,雷达图" ["intro"]=> string(288) "目录 ECharts 异步加载 ECharts 数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具,而是在交互、性能、数据处理等方面有更高的要求。 chart.setOption({ color: [ " ["username"]=> string(7) "chengxs" ["tagsname"]=> string(28) "数据可视化|前端学习" ["tagsid"]=> string(9) "[396,397]" ["catesname"]=> string(18) "前端基本知识" ["catesid"]=> string(5) "[198]" ["createtime"]=> string(10) "1511397800" ["_id"]=> string(3) "422" } [7]=> array(10) { ["id"]=> string(3) "421" ["text"]=> string(36) "C#表达式目录树(Expression)" ["intro"]=> string(288) "目录 ECharts 异步加载 ECharts 数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具,而是在交互、性能、数据处理等方面有更高的要求。 chart.setOption({ color: [ " ["username"]=> string(4) "wwym" ["tagsname"]=> string(0) "" ["tagsid"]=> string(2) "[]" ["catesname"]=> string(4) ".NET" ["catesid"]=> string(7) "["119"]" ["createtime"]=> string(10) "1511397474" ["_id"]=> string(3) "421" } [8]=> array(10) { ["id"]=> string(3) "420" ["text"]=> string(47) "数据结构 队列_队列实例:事件处理" ["intro"]=> string(288) "目录 ECharts 异步加载 ECharts 数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具,而是在交互、性能、数据处理等方面有更高的要求。 chart.setOption({ color: [ " ["username"]=> string(7) "idreamo" ["tagsname"]=> string(40) "C语言|数据结构|队列|事件处理" ["tagsid"]=> string(23) "["246","247","248",395]" ["catesname"]=> string(12) "数据结构" ["catesid"]=> string(7) "["133"]" ["createtime"]=> string(10) "1511397279" ["_id"]=> string(3) "420" } [9]=> array(10) { ["id"]=> string(3) "419" ["text"]=> string(47) "久等了,博客园官方Android客户端发布" ["intro"]=> string(288) "目录 ECharts 异步加载 ECharts 数据可视化在过去几年中取得了巨大进展。开发人员对可视化产品的期望不再是简单的图表创建工具,而是在交互、性能、数据处理等方面有更高的要求。 chart.setOption({ color: [ " ["username"]=> string(3) "cmt" ["tagsname"]=> string(0) "" ["tagsid"]=> string(2) "[]" ["catesname"]=> string(0) "" ["catesid"]=> string(2) "[]" ["createtime"]=> string(10) "1511396549" ["_id"]=> string(3) "419" } } ["count"]=> int(200) } 222 第四天学习进度--(KBQA)初接触知识图谱之构建知识图谱(一) - 爱码网

 知识图谱,在经过一个大体的网上资料的搜索之后,简单的来说它是由实体节点和实体之间的关系组成的一个图结构。

根据网上了解到的这种关系,在使用neo4j构建知识图谱之前,我决定利用python中的networkx工具来自己构建一个知识图谱,以此来加深自己对于知识图谱的关系之后,再学习neo4j构建知识图谱并将其应用到实际的例子中。

networkx是一个处理复杂图结构的一个python工具,一般用在网络拓扑结构的处理当中。在将其转化为知识图谱的过程中,我们需要添加节点之间的关系,经过上述的简单分析,我们开始一个最简单的知识图谱的构建过程。

在构建之前,简单了解networkx提供的函数。

因为networkx相对于neo4j的安装更加容易,且在使用的过程中更加方便。所以暂时先以networkx作为接触知识图谱的一个例子。networkx为我们处理复杂网络提供了特别简单的函数调用,且声明简介易懂。

导入networkx

import networkx as nx

创建有向图

DG = nx.DiGraph()

创建无向图

G = nx.Graph()

创建多重无向图

MG = nx.MultiGraph()

创建多重有向图

MDG = nx.MultiDigraph()

清空图

G.clear()

添加节点

G.add_node(node)

添加边

G.add_edge(node1,node2[,weight])

删除节点

G.remove_node(node)

获得前驱节点

G.predecessors(node)

获得后继节点

G.successors(node)

分配节点属性

G.node[node]['attribute'] = 'info'

添加图属性

G.graph['attribute'] = 'info'

添加边属性

G[node1][node2]['attribute'] = 'info'

迪杰斯特拉求最短路径

dijkstra_path(G, source, target, weight='weight')

求最短距离

dijkstra_path_length(G, source, target, weight='weight')

图的所有边,以元组的列表为结果

F.edges([,date=True])

图的所有节点

G.nodes([,data=True])

 获得邻居节点

G.neighbors(node)

 

了解了networkx的一些基本的函数之后,现在开始一个简单的知识图谱构建的过程。

在构建知识图谱之前,我们得准备一些预料或者知识网络来开始构建我们的知识图谱,那么就以一个简单的知识网络为例子。

第四天学习进度--(KBQA)初接触知识图谱之构建知识图谱(一)

 

已知张三是李四的朋友,张三现任职于贪心科技(其中张三和李四的关系),根据这种图中所展示的关系,我们对这个社交网络进行还原并构建为networkx中的网络拓扑结构。

那么我们开始构建一个图,由图可以分析得到这是一个有向图。(构建的网络是一个有向图而不是无向图,因为节点和节点之间的关系是有向的,即使通常我们在认为A和B是朋友的这种情况通常来说是双向的,但也有可能A认为B是自己的朋友,而B却不认为A是自己的朋友的这种情况)

并将展示可能用到的函数都构造成一个函数,以便以后能够通用。


#!/usr/bin/env python
# -*- coding:utf-8 -*-
# @Time : 2020/7/11 13:32
# @Author: hdq
# @File : simple_knowledge.py
import networkx as nx

#添加双向关系
def add_double_edge(digraph: nx.DiGraph, node1, node2, info=None, relation='relation'):
digraph.add_edge(node1, node2)
digraph.add_edge(node2, node1)
digraph[node2][node1][relation] = info
digraph[node1][node2][relation] = info

#添加单向关系
def add_edge(digraph: nx.DiGraph, node1, node2, info=None, relation='relation'):
digraph.add_edge(node1, node2)
digraph[node1][node2][relation] = info

#获取边的全部relation
def get_edges_relation(digraph: nx.DiGraph,relation="relation"):
result = []
for one in digraph.edges(data=True):
result.append(one[2][relation])
return set(result)

#获取为relation为info的所有边
def get_relation_edges(digraph: nx.DiGraph,info=None,relation="relation"):
result = []
for one in digraph.edges(data=True):
if (one[2][relation] == info):
result.append((one[0],one[1]))
return set(result)

#添加节点属性
def add_node_attribute(digraph: nx.DiGraph,nodelist,info=None):
digraph.add_nodes_from(nodelist,attribute=info)

#获取全部节点的attribute
def get_nodes_attribute(digraph: nx.DiGraph):
result=[]
for one in digraph.nodes(data=True):
result.append(one[1]["attribute"])
return set(result)

#获取attribute为info的所有节点
def get_attribute_nodes(digraph: nx.DiGraph,info=None):
result=[]
for one in digraph.nodes(data=True):
if(one[1]["attribute"]==info):
result.append(one[0])
return set(result)


#创建有向图
G = nx.DiGraph()
#添加节点及其属性
add_node_attribute(G,['张三','李四','小五','小四'],'人')
add_node_attribute(G,['贪心科技','腾讯'],'公司')

print("所有的节点属性:",get_nodes_attribute(G))
print("所有属性为公司的节点:",get_attribute_nodes(G,"公司"))
print("所有属性为人的节点:",get_attribute_nodes(G,"人"))
print("当前所有节点信息:",G.nodes(data=True))

#添加属性间的关系
add_double_edge(G,'张三','李四','朋友')
add_edge(G,'张三','贪心科技','现任职于')
add_edge(G,'小五','贪心科技')
add_double_edge(G,'小五','小四','同事')
add_edge(G,'小五','腾讯','现任职于')
add_edge(G,'小四','腾讯','曾任职于')

print("所有边的属性:",get_edges_relation(G))
print("所有属性为朋友的边:",get_relation_edges(G,"朋友"))
print("当前所有边信息:",G.edges(data=True))

print("张三和李四的关系:",G['张三']['李四']['relation'])

 上述代码运行的结果:

第四天学习进度--(KBQA)初接触知识图谱之构建知识图谱(一)

 

相关文章: