【人工智能】知识图谱
创始人
2024-03-07 19:59:38
0

文章目录

  • 一、知识图谱的概况
  • 二、知识图谱的基本概念
  • 三、知识图谱构建技术
  • 四、知识图谱主要应用
  • 四、知识图谱主要应用

一、知识图谱的概况

知识(Knowledge):合理性(Justified)、真实性(True)、被相信(Believed)

知识是人类通过观察、学习和思考有关客观世界的各种现象而获得并总结出的所有事实(Fact)、概念(Concept)、规则(Rule)或原则(Principle)的集合,分为陈述性知识过程性知识,又可分为概念知识事实知识规则知识

知识图谱是一种语义网络(Semantic Network)的知识库,可以构建庞大的知识网络,包含世间万物构成的实体以及它们之间的关系,图文并茂地展现知识方方面面的属性,让人们更便捷地获取信息、找到所求

二、知识图谱的基本概念

图:一种有效表示数据之间结构的表达形式

知识图谱:旨在以结构化的形式、描述现实世界中存在的概念、实体及其间关系的语义网络
(体系化、关系化、知识可视化)

本体论:来自形而上学(研究第一原则或事物本质的学科)的一个哲学分支,研究存在Being的哲学问题,对世界上任何领域内的真实存在所做出的客观描述

信息领域的本体:形式化、对于共享概念体系的明确且详细的说明

本体反映的知识是一种明确定义的共识,本体是同一领域内不同主体之间进行交流、连通的语义基础,其在知识图谱中的地位相当于知识库的模具,其最大的特点是共享的,位于模式层,用于描述概念层次体系。是知识库中知识的概念模板

  • 实体(entity):现实世界中的具有可区别性且独立存在的某种具体事物,是知识图谱中的最基本元素
  • 类(class)或概念(concepts):相同性质的客观事物集合(类别、对象类型、事物的种类)
  • 关系(relations):某个领域中概念或实体之间的外在相互联系
  • 属性(attribute, property):某个实体或概念的固有内在特性
  • 公理(axiom):描述领域内总时成立(为真)的陈述

各种常见实体间关系:

  • part-of(部分与整体之间的关系)
  • kind-of(继承,例如父类和子类;给出两个概念CCC和DDD,记SC={x∣x是C的实例}S_C=\{x|x\text{是}C\text{的实例}\}SC​={x∣x是C的实例},SD={x∣x是D的实例}S_D=\{x|x\text{是}D\text{的实例}\}SD​={x∣x是D的实例},若SD⊆SCS_D\subseteq S_CSD​⊆SC​,则称CCC为DDD的父概念,DDD为CCC的子概念)
  • instance-of(概念的实例与概念之间的关系)
  • attribute-of(属性,e.g. 概念“颜色”是概念“玫瑰花”的一个属性)

属性图(Property Graph):可以表示实体和关系的属性

资源描述框架(Resource Description Network):另一种表示知识图谱的方式,由很多三元组(Triples)来组成,不支持属性

知识图谱的基本单位:“实体1-关系-实体2”“实体、属性、属性值”构成的三元组

知识图谱示例1
知识图谱示例2

本体的特征:概念化、明确化、形式化、共享性

知识图谱的构成:

  • 知识图谱:包含多种类型的节点(概念、实体)、多种类型的边(概念或实体的属性、概念 或实体间的关系)的多关系图
  • 图:由节点和无向边组成,通常只包含一种类型的节点和边
  • 多关系图:包含多种类型的节点和多种类型的边

知识图谱的存储:两种方式

  • 基于RDF的存储(三元组,不包含属性信息)
  • 基于图数据库的存储(更容易表达现实的业务场景)

知识图谱示例:

知识图谱示例3
知识图谱示例4

三、知识图谱构建技术

按照数据的结构化程度来分,原始的数据可以分为:

  • 结构化数据
  • 半结构化数据
  • 非结构化数据

根据数据的不同的结构化形式,采用不同的方法,将数据转换为三元组的形式

然后对三元组的数据进行知识融合,主要是实体对齐,以及和数据模型进行结合,经过融合之后,会形成标准的数据表示,为了发现新知识,可以依据一定的推理规则,产生隐含的知识,所有形成的知识经过一定的质量评估,最终进入知识图谱

依据知识图谱这个数据平台,可以实现语义搜索,智能问答,推荐系统等一些应用

知识图谱构建:

  • 原始数据
  • 信息提取
  • 知识融合
  • 知识加工
  • 知识更新

知识图谱构建


四、知识图谱主要应用

知识图谱架构逻辑结构技术架构模式层(本体库)数据层(客观事实,三元组)信息提取知识表示知识融合知识加工知识更新实体抽取关系抽取属性抽取传统表示方法:三元组SPO深度学习为代表的技术:稠密地位实值向量实体链接知识合并本体构建知识推理质量评估全面更新:以更新后的全部数据为输入增量更新:以当前新增数据为输入

实体抽取示例:
实体抽取1
⇓\LARGE{\Downarrow}⇓
实体抽取2

四、知识图谱主要应用

  • 语义搜索/智能搜索
  • 人物关系图
  • 智能问答
  • 领域概念关系、风险分析
  • 可视化决策支持(反欺诈)
  • 个性化服务、辅助决策

国外知识图谱项目:

  • 常识知识库:Cyc、WorldNet、ConceptNet
  • 互联网知识图谱:FreeBase、DBpedia、Schema、Wikidata、BableNet、Microsoft ConceptGraph,医疗领域Linked Life Data等

国内知识图谱项目:

  • OpenKG、CN-DBpedia、中医药知识图谱、阿里电商知识图谱、美团知识图谱、XLore(清华大学)、Belief-Eigen(中科院)、PKUPie(北京大学)等

最新的知识图谱搜索引擎Magi

相关内容

热门资讯

常用商务英语口语   商务英语是以适应职场生活的语言要求为目的,内容涉及到商务活动的方方面面。下面是小编收集的常用商务...
六年级上册英语第一单元练习题   一、根据要求写单词。  1.dry(反义词)__________________  2.writ...
复活节英文怎么说 复活节英文怎么说?复活节的英语翻译是什么?复活节:Easter;"Easter,anniversar...
2008年北京奥运会主题曲 2008年北京奥运会(第29届夏季奥林匹克运动会),2008年8月8日到2008年8月24日在中华人...
英语道歉信 英语道歉信15篇  在日常生活中,道歉信的使用频率越来越高,通过道歉信,我们可以更好地解释事情发生的...
六年级英语专题训练(连词成句... 六年级英语专题训练(连词成句30题)  1. have,playhouse,many,I,toy,i...
上班迟到情况说明英语   每个人都或多或少的迟到过那么几次,因为各种原因,可能生病,可能因为交通堵车,可能是因为天气冷,有...
小学英语教学论文 小学英语教学论文范文  引导语:英语教育一直都是每个家长所器重的,那么有关小学英语教学论文要怎么写呢...
英语口语学习必看的方法技巧 英语口语学习必看的方法技巧如何才能说流利的英语? 说外语时,我们主要应做到四件事:理解、回答、提问、...
四级英语作文选:Birth ... 四级英语作文范文选:Birth controlSince the Chinese Governmen...
金融专业英语面试自我介绍 金融专业英语面试自我介绍3篇  金融专业的学生面试时,面试官要求用英语做自我介绍该怎么说。下面是小编...
我的李老师走了四年级英语日记... 我的李老师走了四年级英语日记带翻译  我上了五个学期的小学却换了六任老师,李老师是带我们班最长的语文...
小学三年级英语日记带翻译捡玉... 小学三年级英语日记带翻译捡玉米  今天,我和妈妈去外婆家,外婆家有刚剥的`玉米棒上带有玉米籽,好大的...
七年级英语优秀教学设计 七年级英语优秀教学设计  作为一位兢兢业业的人民教师,常常要写一份优秀的教学设计,教学设计是把教学原...
我的英语老师作文 我的英语老师作文(通用21篇)  在日常生活或是工作学习中,大家都有写作文的经历,对作文很是熟悉吧,...
英语老师教学经验总结 英语老师教学经验总结(通用19篇)  总结是指社会团体、企业单位和个人对某一阶段的学习、工作或其完成...
初一英语暑假作业答案 初一英语暑假作业答案  英语练习一(基础训练)第一题1.D2.H3.E4.F5.I6.A7.J8.C...
大学生的英语演讲稿 大学生的英语演讲稿范文(精选10篇)  使用正确的写作思路书写演讲稿会更加事半功倍。在现实社会中,越...
VOA美国之音英语学习网址 VOA美国之音英语学习推荐网址 美国之音网站已经成为语言学习最重要的资源站点,在互联网上还有若干网站...
商务英语期末试卷 Part I Term Translation (20%)Section A: Translate ...