什么是知识图谱
知识图谱属于人工智能的重要分支——知识工程的研究范畴,是利用知识工程理论建立大规模知识资源的一个杀手级应用。知识图谱给互联网语义搜索带来新的活力,在智能问答中也大显神威,已经成为知识驱动的智能应用的基础设施。知识图谱与大数据和深度学习一起,已经成为推动互联网和人工智能发展的核心驱动力之一。
1. 定义
知识图谱在学术界还没有统一的定义,根据维基百科,知识图谱2012年首先由谷歌公司提出,是一个提供智能搜索服务的大型知识库。因此,这里我们可以将知识图谱理解为,对语义知识的一种形式化描述框架。
2. 意义
知识图谱从语义角度出发,通过描述客观世界中概念、实体及其关系,从而让计算机具备更好地组织、管理和理解互联网上海量信息的能力。更具体的说,在人类与互联网世界交互的过程中,产生了繁杂庞大的信息,这些信息一般被图片声音文字视频这些数据载体保存。我们希望计算机可以分析阅读理解这些数据,精准挖掘找到数据背后隐藏的有价值的知识,在用户需要的时候提供知识服务。
医学知识图谱的作用
在专业化程度集中的医疗领域,这些知识往往来源于经过严格的行业内审核、在行业内达成共识的内容,例如教科书、临床指南、临床路径等资料。然而,这些资料大多以非结构化的形式呈现,存在数据处理复杂,开发门槛高的问题,限制了知识能力的释放,更不用说让机器去理解和应用知识。
如果我们提前把这些资料以一种机器可读的形式整理好,让机器直接去读取,是否可行呢?
答案是可行的,以这些医学资料为基础建立医学知识图谱,可以将其中自由文本形式的内容转化为完全结构化、计算机可理解的形式,与非结构的文本数据相比,结构化的知识图谱可以一种更加清晰、准确的方式表示人类知识,便于机器读取和应用。
医学知识图谱助力医疗健康行业多场景应用
卫和医学基于专业医学知识库、医学专著、国内外诊疗指南、专家共识、临床病例及国内外医学领域专家的融合及服务支持,结合NLP、知识图谱等数字化技术及健康风险科学评估和干预等相关理论、知识,实现了多元关系型数据深度加工和融合,形成了以疾病为核心的高结构化、高时效性、高完备性的数字化临床诊疗及慢性病评估、干预的自主知识产权知识图谱,为大健康全行业提供医学数字化赋能。
卫和医学知识库覆盖疾病1万+、症状5000+、药品20万+、逻辑关联30万+、实体数量50万+且数据不断更新中。卫和医学知识库核心知识内容由协和医院、阜外医院等三甲医院的上百位权威专家带头,包含院士、学科主委、学科带头人,他们有丰富的临床、科研经验,在各个专科领域享有高知名度和影响力,通过对权威指南、共识、医学资料及行业研究进展梳理,通过严谨的医学知识加工及审核流程,最终形成权威专业传染病知识库。
通过对大量精选的医学数据进行深度机器学习,挖掘并计算出不同类型的医学关联图谱并且由专家组织审核修改,形成多种类型的知识图谱,为行业用户提供可靠医学知识数据服务。
医学知识图谱应用
1|辅助问答
知识图谱可以提升问答机器人等的智能化程度。在这种全新的人机交互形式下,对信息要求有更高的整合度、覆盖度和语义化,知识图谱扮演者“大脑”的角色。
2|辅助搜索
知识图谱推动了搜索从网页搜索向语义搜索的转变。相较于传统搜索,知识图谱在搜索中进行了三方面的优化:一是加大结果准确;二是相关联结果呈现更详细;三是可以通过互动、点击拓展搜索的深度和广度。
3|辅助决策
知识图谱作为知识库的一部分嵌入到决策流程中,辅助智能化决策。
4|药物研发
近年来,人工智能辅助药物研发逐渐成为研究的热点。知识图谱可应用于药物研发的知识的聚类分析,帮助提出新的可以被验证的假说,从而加速药物研发的过程,降低研发成本。
3|公共卫生事件应对
在流行病学调查和疫情发生事件的分析和预警等 公共卫生事件场景中,知识图谱采用图存储数据的理念可以起到非常大的帮助。例如,利用知识图谱的形式可以直观地表示流行病调查中的人员分布、人员活动轨迹、发病时间等信息,基于图展示出的信息可以更方便的用于病例之间相关性的分析,更快地分析和梳理出感染源头。
返回搜狐,查看更多