【人工智能】知识图谱
然后对三元组的数据进行知识融合,主要是实体对齐,以及和数据模型进行结合,经过融合之后,会形成标准的数据表示,为了发现新知识,可以依据一定的推理规则,产生隐含的知识,所有形成的知识经过一定的质量评估,最终进入知识图谱。知识图谱是一种语义网络(Semantic Network)的知识库,可以构建庞大的知识网络,包含世间万物构成的实体以及它们之间的关系,图文并茂地展现知识方方面面的属性,让人们更便捷地获
一、知识图谱的概况
知识(Knowledge):合理性(Justified)、真实性(True)、被相信(Believed)
知识是人类通过观察、学习和思考有关客观世界的各种现象而获得并总结出的所有事实(Fact)、概念(Concept)、规则(Rule)或原则(Principle)的集合,分为陈述性知识和过程性知识,又可分为概念知识、事实知识、规则知识。
知识图谱是一种语义网络(Semantic Network)的知识库,可以构建庞大的知识网络,包含世间万物构成的实体以及它们之间的关系,图文并茂地展现知识方方面面的属性,让人们更便捷地获取信息、找到所求
二、知识图谱的基本概念
图:一种有效表示数据之间结构的表达形式
知识图谱:旨在以结构化的形式、描述现实世界中存在的概念、实体及其间关系的语义网络
(体系化、关系化、知识可视化)
本体论:来自形而上学(研究第一原则或事物本质的学科)的一个哲学分支,研究存在Being的哲学问题,对世界上任何领域内的真实存在所做出的客观描述
信息领域的本体:形式化、对于共享概念体系的明确且详细的说明
本体反映的知识是一种明确定义的共识,本体是同一领域内不同主体之间进行交流、连通的语义基础,其在知识图谱中的地位相当于知识库的模具,其最大的特点是共享的,位于模式层,用于描述概念层次体系。是知识库中知识的概念模板
- 实体(entity):现实世界中的具有可区别性且独立存在的某种具体事物,是知识图谱中的最基本元素
- 类(class)或概念(concepts):相同性质的客观事物集合(类别、对象类型、事物的种类)
- 关系(relations):某个领域中概念或实体之间的外在相互联系
- 属性(attribute, property):某个实体或概念的固有内在特性
- 公理(axiom):描述领域内总时成立(为真)的陈述
各种常见实体间关系:
- part-of(部分与整体之间的关系)
- kind-of(继承,例如父类和子类;给出两个概念 C C C和 D D D,记 S C = { x ∣ x 是 C 的实例 } S_C=\{x|x\text{是}C\text{的实例}\} SC={x∣x是C的实例}, S D = { x ∣ x 是 D 的实例 } S_D=\{x|x\text{是}D\text{的实例}\} SD={x∣x是D的实例},若 S D ⊆ S C S_D\subseteq S_C SD⊆SC,则称 C C C为 D D D的父概念, D D D为 C C C的子概念)
- instance-of(概念的实例与概念之间的关系)
- attribute-of(属性,e.g. 概念“颜色”是概念“玫瑰花”的一个属性)
属性图(Property Graph):可以表示实体和关系的属性
资源描述框架(Resource Description Network):另一种表示知识图谱的方式,由很多三元组(Triples)来组成,不支持属性
知识图谱的基本单位:“实体1-关系-实体2”、“实体、属性、属性值”构成的三元组
本体的特征:概念化、明确化、形式化、共享性
知识图谱的构成:
- 知识图谱:包含多种类型的节点(概念、实体)、多种类型的边(概念或实体的属性、概念 或实体间的关系)的多关系图
- 图:由节点和无向边组成,通常只包含一种类型的节点和边
- 多关系图:包含多种类型的节点和多种类型的边
知识图谱的存储:两种方式
- 基于RDF的存储(三元组,不包含属性信息)
- 基于图数据库的存储(更容易表达现实的业务场景)
知识图谱示例:
三、知识图谱构建技术
按照数据的结构化程度来分,原始的数据可以分为:
- 结构化数据
- 半结构化数据
- 非结构化数据
根据数据的不同的结构化形式,采用不同的方法,将数据转换为三元组的形式
然后对三元组的数据进行知识融合,主要是实体对齐,以及和数据模型进行结合,经过融合之后,会形成标准的数据表示,为了发现新知识,可以依据一定的推理规则,产生隐含的知识,所有形成的知识经过一定的质量评估,最终进入知识图谱
依据知识图谱这个数据平台,可以实现语义搜索,智能问答,推荐系统等一些应用
知识图谱构建:
- 原始数据
- 信息提取
- 知识融合
- 知识加工
- 知识更新
实体抽取示例:
⇓
\LARGE{\Downarrow}
⇓
四、知识图谱主要应用
- 语义搜索/智能搜索
- 人物关系图
- 智能问答
- 领域概念关系、风险分析
- 可视化决策支持(反欺诈)
- 个性化服务、辅助决策
国外知识图谱项目:
- 常识知识库:Cyc、WorldNet、ConceptNet
- 互联网知识图谱:FreeBase、DBpedia、Schema、Wikidata、BableNet、Microsoft ConceptGraph,医疗领域Linked Life Data等
国内知识图谱项目:
- OpenKG、CN-DBpedia、中医药知识图谱、阿里电商知识图谱、美团知识图谱、XLore(清华大学)、Belief-Eigen(中科院)、PKUPie(北京大学)等
最新的知识图谱搜索引擎Magi
更多推荐
所有评论(0)