一、知识图谱的概况

知识(Knowledge):合理性(Justified)、真实性(True)、被相信(Believed)

知识是人类通过观察、学习和思考有关客观世界的各种现象而获得并总结出的所有事实(Fact)、概念(Concept)、规则(Rule)或原则(Principle)的集合,分为陈述性知识过程性知识,又可分为概念知识事实知识规则知识

知识图谱是一种语义网络(Semantic Network)的知识库,可以构建庞大的知识网络,包含世间万物构成的实体以及它们之间的关系,图文并茂地展现知识方方面面的属性,让人们更便捷地获取信息、找到所求

二、知识图谱的基本概念

图:一种有效表示数据之间结构的表达形式

知识图谱:旨在以结构化的形式、描述现实世界中存在的概念、实体及其间关系的语义网络
(体系化、关系化、知识可视化)

本体论:来自形而上学(研究第一原则或事物本质的学科)的一个哲学分支,研究存在Being的哲学问题,对世界上任何领域内的真实存在所做出的客观描述

信息领域的本体:形式化、对于共享概念体系的明确且详细的说明

本体反映的知识是一种明确定义的共识,本体是同一领域内不同主体之间进行交流、连通的语义基础,其在知识图谱中的地位相当于知识库的模具,其最大的特点是共享的,位于模式层,用于描述概念层次体系。是知识库中知识的概念模板

  • 实体(entity):现实世界中的具有可区别性且独立存在的某种具体事物,是知识图谱中的最基本元素
  • 类(class)或概念(concepts):相同性质的客观事物集合(类别、对象类型、事物的种类)
  • 关系(relations):某个领域中概念或实体之间的外在相互联系
  • 属性(attribute, property):某个实体或概念的固有内在特性
  • 公理(axiom):描述领域内总时成立(为真)的陈述

各种常见实体间关系:

  • part-of(部分与整体之间的关系)
  • kind-of(继承,例如父类和子类;给出两个概念 C C C D D D,记 S C = { x ∣ x 是 C 的实例 } S_C=\{x|x\text{是}C\text{的实例}\} SC={xxC的实例} S D = { x ∣ x 是 D 的实例 } S_D=\{x|x\text{是}D\text{的实例}\} SD={xxD的实例},若 S D ⊆ S C S_D\subseteq S_C SDSC,则称 C C C D D D的父概念, D D D C C C的子概念)
  • instance-of(概念的实例与概念之间的关系)
  • attribute-of(属性,e.g. 概念“颜色”是概念“玫瑰花”的一个属性)

属性图(Property Graph):可以表示实体和关系的属性

资源描述框架(Resource Description Network):另一种表示知识图谱的方式,由很多三元组(Triples)来组成,不支持属性

知识图谱的基本单位:“实体1-关系-实体2”“实体、属性、属性值”构成的三元组

知识图谱示例1
知识图谱示例2

本体的特征:概念化、明确化、形式化、共享性

知识图谱的构成:

  • 知识图谱:包含多种类型的节点(概念、实体)、多种类型的边(概念或实体的属性、概念 或实体间的关系)的多关系图
  • 图:由节点和无向边组成,通常只包含一种类型的节点和边
  • 多关系图:包含多种类型的节点和多种类型的边

知识图谱的存储:两种方式

  • 基于RDF的存储(三元组,不包含属性信息)
  • 基于图数据库的存储(更容易表达现实的业务场景)

知识图谱示例:

知识图谱示例3
知识图谱示例4

三、知识图谱构建技术

按照数据的结构化程度来分,原始的数据可以分为:

  • 结构化数据
  • 半结构化数据
  • 非结构化数据

根据数据的不同的结构化形式,采用不同的方法,将数据转换为三元组的形式

然后对三元组的数据进行知识融合,主要是实体对齐,以及和数据模型进行结合,经过融合之后,会形成标准的数据表示,为了发现新知识,可以依据一定的推理规则,产生隐含的知识,所有形成的知识经过一定的质量评估,最终进入知识图谱

依据知识图谱这个数据平台,可以实现语义搜索,智能问答,推荐系统等一些应用

知识图谱构建:

  • 原始数据
  • 信息提取
  • 知识融合
  • 知识加工
  • 知识更新

知识图谱构建

知识图谱架构
逻辑结构
技术架构
模式层(本体库)
数据层(客观事实,三元组)
信息提取
知识表示
知识融合
知识加工
知识更新
实体抽取
关系抽取
属性抽取
传统表示方法:三元组SPO
深度学习为代表的技术:稠密地位实值向量
实体链接
知识合并
本体构建
知识推理
质量评估
全面更新:以更新后的全部数据为输入
增量更新:以当前新增数据为输入

实体抽取示例:
实体抽取1
⇓ \LARGE{\Downarrow}
实体抽取2

四、知识图谱主要应用

  • 语义搜索/智能搜索
  • 人物关系图
  • 智能问答
  • 领域概念关系、风险分析
  • 可视化决策支持(反欺诈)
  • 个性化服务、辅助决策

国外知识图谱项目:

  • 常识知识库:Cyc、WorldNet、ConceptNet
  • 互联网知识图谱:FreeBase、DBpedia、Schema、Wikidata、BableNet、Microsoft ConceptGraph,医疗领域Linked Life Data等

国内知识图谱项目:

  • OpenKG、CN-DBpedia、中医药知识图谱、阿里电商知识图谱、美团知识图谱、XLore(清华大学)、Belief-Eigen(中科院)、PKUPie(北京大学)等

最新的知识图谱搜索引擎Magi

Logo

NVIDIA官方入驻,分享最新的官方资源以及活动/会议信息,精选收录AI相关技术内容,欢迎大家加入社区并参与讨论。

更多推荐