当前位置:»资讯 AI新闻 全球AI最前线

[行业动态] 谷歌开源HeAR:听声辨病,用AI分析咳嗽声评估健康状况

Coughing_person_with_hand_before_mouth_sound_waves_illustration-Midjourney-1200x673.png

谷歌研究院近日开发出一套名为HeAR(Health Acoustic Representations)的AI系统,能够通过分析咳嗽和呼吸声来评估健康状况。该公司已公开发布这一系统的代码,供其他研究人员使用。

HeAR采用自监督学习方法,在超过3亿条来自YouTube的非版权短音频片段上进行训练。其神经网络基于Transformer架构,通过重建被隐藏的音频谱图部分来学习提取相关的健康信息。
google_hear.png

研究人员在33项任务上测试了HeAR的性能,包括识别与健康相关的声音、分类咳嗽录音和估算肺功能值。在大多数基准测试中,HeAR的表现优于现有的音频AI模型。

在从咳嗽声中检测结核病方面,HeAR的准确率(AUROC)达到0.739,显著超过第二名模型TRILL的0.652。研究人员认为,这一技术有潜力在资源匮乏地区识别需要进一步检测的人群。

此外,HeAR在通过智能手机录音估算肺功能参数方面也表现出色。对于一秒容积(FEV1)的估算,其平均误差仅为0.418升,优于最佳对比方法的0.479升。这可能为肺部疾病(如慢性阻塞性肺病)的筛查提供新的便捷工具。

研究人员强调,HeAR目前仍处于研究阶段,任何诊断应用都需要经过临床验证。该系统还存在一些技术限制,如目前只能处理两秒钟的音频片段。谷歌计划通过模型蒸馏和量化等技术,使HeAR能够更高效地直接在移动设备上运行。

联合国支持的"终止结核伙伴关系"组织对这一方法表示支持。研究人员现可向谷歌申请获取经过训练的HeAR模型和匿名化的CIDRZ数据集(咳嗽音频数据)。更多信息可在GitHub上查阅。

声明: 本站所有内容来源于用户上传,用来分享交流。如有资料或者图片不小心侵权,请发邮件(41835170@qq.com)告知!
分享到:
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

豫ICP备2024052610号-1 ©AI闹海