$科大讯飞(SZ002230)$算法破译婴儿哭声密码:婴儿啼哭声识别挑战赛等你来战!
原创 讯飞开放平台 讯飞开放平台 昨天
来自专辑
2020 A.I. 开发者大赛
一声嘹亮的啼哭,象征着新生儿生命旅程的开始,也成为震撼父母心底的美妙音符。但很快,新手父母们就会发现:从此生活被宝宝们一声声的啼哭彻底打乱,毕竟想要听懂这种“婴语”太难了!
01哭声暗藏秘密
醒了哭、饿了哭、困了哭、尿了哭、要抱抱哭、不舒服更要哭……令人吃惊的是,如果将新生儿的每一次哭声都精确记录和计算的话,他们每天大约要哭3个小时。当然这不是一次把哭的时间都用完,他们每次的哭声也不是在诉说着同一件事。

实际上,对婴儿来说,啼哭声是一种特殊的通讯语言,一个非常有限的、但类似成年人进行沟通交流的方式,它作为一种生物报警器,代表着婴儿向外界表达心理情感,反映生理诉求。婴儿哭声的一些早期科学研究集中在其声学特性上,例如基本频率(即音调)和持续时间(即哭声的长度)揭示了婴儿的潜在状况。基于啼哭声声波携带的信息,婴儿的身体状况才能被确定,疾病才能被及时检测出来。
诸多研究结果表明:婴儿某些哭声可以表明健康问题,甚至预示着婴儿患有某些致命疾病的可能性。
美国布朗医学院的琳达·拉加塞表示,婴儿哭声信号具有潜力巨大的医学诊断价值,至少暗藏6种疾患线索。比如,声音特别高的哭泣可以告诉我们婴儿也许生病了,因此,哭声信号可以作为一种早期预警信号,以便对婴儿的神经系统进行进一步检查。
除了知晓身体健康、预测疾病,德国科学家的研究还发现,每个婴儿啼哭的声调变化并不一样,声调变化越丰富,表明这个婴儿以后的语言能力就越强。德国维尔茨堡大学的韦姆克说,新生儿在刚出生一周内啼哭的声调越丰富,那么当他长到一岁半时,就越可以本能地学会更多的词句。反之,旋律单一的啼哭声可能预示着这名婴儿以后学说话的困难会大些。
02一个世纪难题
面对一个不会讲话的初生婴儿,作为家长,怎么才能迅速理解宝宝哭声里的需求呢?这成为困扰世界各地新手父母心头的难题。现实中,育儿社区随处可见的求助问题也反映了年轻父母们对于婴儿啼哭声识别的真实诉求。


美国、中国台湾、西班牙、日本等团队都曾做过相关研究,通过程序分析哭声可给出肚子疼、尿布湿、想睡觉等原因。各团队都声明可覆盖95%以上的宝宝啼哭原因、准确度比人提高3倍等,但各团队找到的原因却不一致。
2016年,日本First-Ascent公司声称推出了一项以人工智能为基础的技术,可根据婴儿的哭声分析原因,并计划将该技术加入到APP中。但目前情况是缺乏实验数据、没可用产品、未本土化落地。
03婴儿啼哭声识别挑战赛
婴儿啼哭,作为一种模糊类语言,有着天然的技术辨别难度,伴随每次哭声识别后用户的反馈记录与音频数据的分析,通过机器学习对这些哭声频率和特征进行分析学习,其算法训练也在不断进化。
基于此,有效辨识婴儿啼哭声,准确地将它们“翻译”为“成人语言”,让我们能够读懂啼哭声背后的诉求,具有重大的实际应用意义。
一年一度面向全球开发者发起的人工智能竞赛平台——2020 iFLYTEK A.I.开发者大赛正在火热报名中!其中,A.I.算法赛道中的婴儿啼哭声识别挑战赛,由中国科学技术大学作为出题方,从真实场景和实际应用出发,旨在判别婴儿啼哭声所传递的信息,设置了挑战性、务实性俱佳的任务,期待参赛选手们能在挑战赛中相互切磋、共同进步。下面请看赛题解读:
Q:
赛题任务要求是什么?
A:
相比其他竞赛,本次竞赛所提供的训练数据更少,总体表现为低资源的竞赛任务,具体包含:
初赛:训练数据集每类啼哭声只包含两条音频数据,简单噪声环境下识别。
复赛:复杂噪声环境下婴儿啼哭声识别,判断容易引起混淆的啼哭声,分析各类啼哭声的明显特征及简单直接的判别方式。
Q:
作品提交要求是什么?
A:
1、文件格式:按照csv格式提交
2、文件大小:无要求
3、提交次数限制:每支队伍每天最多3次
4、文件详细说明:
1) 以csv格式提交,编码为UTF-8,第一行为表头;
2) 提交格式见样例;
id,label
test001.wav,hungry
test002.wav,sleepy
5、不需要上传其他文件
6、复赛需提供文档简要分析并回答提要所涉及的相关问题。
随着技术的发展,人工智能已在多领域多行业得以应用,育儿也不例外。我们期待更多开发者加入本届大赛的赛题挑战中,携手推动育儿模式智能化落地。
如有数据说明、赛题规则等更多详情想要了解,您可点击阅读原文进入大赛官网获取一手资讯,或扫码添加大赛小助手微信号,2020 iFLYTEK A.I.开发者大赛期待您的加入!