首页 > 资讯 > 基于机器学习的婴儿哭声解读,Frontiers in Artificial Intelligence

基于机器学习的婴儿哭声解读,Frontiers in Artificial Intelligence


哭泣是婴儿整个成长过程中不可避免的性格特征,在护理人员可能难以解释哭泣的根本原因的情况下。哭泣可以被视为一种音频信号,携带有关婴儿状态的信息,例如不适、饥饿和疾病。主要的婴儿照顾者需要传统的方式来理解这些感受。未能正确理解它们可能会导致严重的问题。有几种方法试图解决这个问题;然而,为了获得更好的结果,适当的音频特征表示和分类器是必要的。本研究使用时域、频域和时频域特征表示来从数据中获取深入的信息。时域特征包括过零率(ZCR)和均方根(RMS),频域特征包括梅尔频谱图,时频域特征包括梅尔频率倒谱系数(MFCC)。此外,还应用时间序列成像算法,使用不同的算法将 20 个 MFCC 特征转换为图像:格拉米亚角差场、格拉米亚角求和场、马尔可夫转换场、递归图和 RGB GAF。然后,将这些特征提供给不同的机器学习分类器,例如决策树、随机森林、K近邻和装袋。使用 MFCC、ZCR 和 RMS 作为功能实现了高性能,超越了现有技术 (SOTA)。通过使用 10 倍交叉验证的网格搜索方法找到最佳参数。我们基于 MFCC 的随机森林 (RF) 分类器方法实现了 96.39% 的准确率,优于 SOTA(基于尺度图的 shuffleNet 分类器),后者的准确率为 95.17%。

"点击查看英文标题和摘要"

相关知识

基于PaddleSpeech的婴儿啼哭识别(上)
基于PaddleSpeech的婴儿啼哭识别:让哭声“说话
基于PaddleSpeech的婴儿啼哭识别:构建婴儿需求理解的桥梁
机器学习技术在环境健康领域中的应用进展
婴儿啼哭声研究与模式分类
硬核奶爸做个“智能婴儿监视器”:啼哭自动通知,还能分析哭声含义
婴儿的哭声怎么形容
一种便携式婴儿啼哭声识别器及其识别方法与流程
破解婴儿啼哭的含义
营养和低碳水化合物饮食专家共识:基于证据和公平的饮食指导方法,Frontiers in Nutrition

网址: 基于机器学习的婴儿哭声解读,Frontiers in Artificial Intelligence https://m.trfsz.com/newsview196147.html