语音识别新冠,到底离我们有多远

Thinkit语音识别小程序

在文章提到,我们发现最近有一款小程序通过语音识别一个人是否感染新冠病毒;语音识别在技术上的基本原理是什么呢?最近的发展有哪些呢?下面请大家随小编来看一下...

在没有现代化的早期社会,医生是如何给病人看病的呢?四字箴言“望闻问切”,其中的闻不仅指气息,同时也包含声音;在现代化的社会,听诊器是必不可少的工具;因此,声音是医学范畴内的重要医疗数据。基于此,我们在人工智能的时代,通过人工智能加持医学,使得机器诊断变得可能。在疫情爆发,全球医疗资源紧张的今天,通过语音识别新冠有望解燃眉之急。

发音器官

在使用语音识别新冠之前我们需要了解一下人的发音基本原理,首先人的发音器官包括:肺、气管、声带、喉、咽、鼻腔、口腔、唇;肺部产生的气流冲击声带,产生震动,从而产生声音。

研究表明,人体发声时会产生相应的生物标记物,当身体出现健康问题时,疾病的特异性干扰会对人体某个系统或多个系统产生细微、肉眼难以察觉、但具有特性的变化,生物标记物含量由此产生变化。而这种变化,可以利用机器来进行检测和分析计算。

声音时、频谱图

卡内基梅隆大学(CMU)一支研究团队长期致力于语音取证技术的研究,他们研究发现人的声音受到器官机构状况和健康程度的影响,能揭示生理/心理甚至医学数据。受新冠肺炎病毒感染的患者,肺部会发生一些病变,其呼吸模式等参数会受到影响,导致发出的声音(呼吸间隔、咳嗽声等)出现一些异常特征,算法通过学习数据能够抓取识别出这些病症。

卡内基梅隆大学(CMU)一支研究团队长期致力于语音取证技术的研究,他们研究发现人的声音受到器官机构状况和健康程度的影响,能揭示生理/心理甚至医学数据。受新冠肺炎病毒感染的患者,肺部会发生一些病变,其呼吸模式等参数会受到影响,导致发出的声音(呼吸间隔、咳嗽声等)出现一些异常特征,算法通过学习数据能够抓取识别出这些病症。

语音识别新冠流程

语音识别新冠整个流程,首先需要数据采集,其次使用这些数据来训练语音模型,模型训练完成后,最后使用训练的模型用于测试人群,得到感染新冠的分数。机器识别的准确率很大程度上取决于数据信息的丰富度,当训练的样本数据足够多,足够丰富,机器判断的准确率也能提高。

下面我们来看看语音识别新冠的一些进展:

卡内基梅隆大学在年4月发布过了一个简易的测试程序,受试者需要填写个人健康相关信息,并录制咳嗽、英文元音的发音,数字和字母表朗读等语音信息。系统最后会返回一个分数,表明所录制的声音和收集到的COVID-19患者数据相比,其感染特征相符合的程度。

ResApp表示,在印度和美国对名患者进行的临床试验中,该算法正确地检测出了92%的新冠病毒感染者。ResAppDx目前在欧洲通过了CE市场认证,在澳大利亚获得了TGA许可批准,值得注意的是,应用程序筛查并不能完全代替临床医生的诊断,但可用作COVID-19的早期预警,或者说是筛查,而不是诊断。

两家以色列健康科技公司BeyondVerbal和Healthymize合并设立的VocalisHealth在年底获得了以色列健康技术和生命科学风险投资公司Amoon牵头的万美元融资。在年2月,Vocalis宣布其COVID-19筛查工具VocalisCheck在大型临床研究中成功验证,并已获得CE标志,成为首个获得CE批准的新冠筛查医疗设备。

剑桥大学也推出了用声音检测COVID-19的项目。但稍有不同的是,剑桥大学仅仅还是只是收集数据,还不提供检测的结果。



转载请注明:http://www.abuoumao.com/hyfz/5560.html

网站简介| 发布优势| 服务条款| 隐私保护| 广告合作| 网站地图| 版权申明

当前时间: 冀ICP备19029570号-7