摘要:
在过去的40年里,发展中国家经济的高速发展引起了人民膳食结构的显著变化,肉类产品消费量增长,慢性疾病成为人类健康的主要杀手,在这种背景下,人们对于获取健康饮食知识的需求日益增长。幸运的是,互联网创造了一个健康饮食信息的搜索、学习和共享平台,但这些信息纷繁复杂,涉及到食物种类、营养、医疗等多个方面,且分布在多个数据源上,为用户的检索和学习带来困难。如何整合这些知识,挖掘隐含在半结构和非结构文本中的概念和语义关系,为健康食物的检索系统提供更加丰富的语义信息是一个具有重要意义的研究问题。目前,学术界和工业界将解决这一问题的方法聚焦在知识图谱领域,基于知识图谱技术出现了许多健康方面的研究和应用系统,但是多数知识图谱集中在专业医疗领域,其中实体和关系多数来自于专家定义、已有知识库等结构化和半结构化数据,从互联网自然语言中提取知识进行自动构建的方案不多,此外,与英文相比,已有的中文领域知识库和训练语料很少,为知识整合带来挑战。本文针对健康饮食数据的特点,定义了知识图谱中主要包含的五个实体,分别是食材、菜品、营养元素、症状和人群,然后从多个健康网站中获取半结构和非结构的文本数据,进行实体识别、关系识别、食物实体对齐,构建中文健康饮食知识图谱并提供了概念检索案例,所提出的模型和方法在小规模训练集上有良好的表现。本文的主要研究内容和贡献如下:(1)定义了一个健康饮食领域知识图谱的数据模式,即图谱的模式层包含的实体类别、属性和实体之间的关系。(2)构建领域词典,定义多种领域特征,并将其融入条件随机场算法中进行实体和关系识别,对自然语言短文中的症状、人群、营养元素三类实体进行了抽取,利用机器学习分类算法对它们和食物之间的关系进行分类。(3)实现了一个食物实体对齐的方法,主要解决食物名称的多样性问题,对相同的食物实体进行整合。(4)基于所构建的知识图谱提出多概念语义检索的应用模型。实验结果表明,本文实现的实体识别、关系分类和实体融合算法具有较高的准确率和召回率,可以保证所构建的知识图谱具有较高的质量。为验证知识图谱的应用价值,本文基于该知识图谱设计了多概念检索模型,并实现了一个原型系统,可以有效管理和检索知识图谱中维护的概念、实体以及它们之间的语义关系,可以帮助非专业用户更加高效全面地检索和学习健康饮食知识。
展开
相关知识
基于中医与营养学的健康饮食知识图谱构建
研究领域
国内大数据与膳食营养健康的研究及应用进展
守护人类健康:人工智能赋能医疗领域创新应用
注册食品科学研究院的研究领域有哪些?
植物性饮食在运动营养领域中的应用研究进展
中国食品发酵工业研究院有限公司 > 科研创新 > 研发领域
人工智能在医疗健康领域中的应用
2023年合成生物学在健康与医药领域的应用
全球环境与健康领域的研究热点,以及我国环境与健康研究面临的机遇与挑战
网址: 健康饮食领域知识图谱构建与应用研究 https://m.trfsz.com/newsview795074.html