Science Advances: 一种可实现卓越人机语音交互的声超球⾯波束形成声学传感器

基于语音的人机交互界面具有强大的声源追踪、语音识别和情感感知能力,是新一代智能机器人传感系统的重要发展方向。这一技术需要同时具有超高信噪比和灵敏度的声学传感器,以在噪声环境中精确识别所需的人声,并具有三维波束形成能力来定位和追踪移动声源。目前商用麦克风和新兴薄膜传感器仍无法解决声波在空间内快速耗散的根本问题。声学超材料拥有调制和操纵声波的无限可能性,已被证明能用于声音的放大和分离。然而,它们难以实现人声范围内的编码和解码,从未同时展现高信噪比和灵敏度,且往往需要繁琐的算法来定位声源,导致其工程可靠性和实际应用场景受到严重限制。
上海交通大学机械与动力工程学院张文明教授课题组和密西根学院邵磊助理教授课题组合作研究了声学超球面声音传感器,基于局域共振和波束形成原理,展示了全向声能采集、压力放大、声源追踪、音频克隆和语音识别等多项功能,即使在强背景噪声环境中也能定位和识别相邻角度的人声。
本文要点:
(1)本研究从声学超材料的局域共振机理出发,利用物理智能构建了多功能空间全向声学超球面传感器,结合增材制造和机器学习优化系统构造,最终提供多场景卓越的人机语音交互,为发展新一代智能机器人听觉系统和更好的人机语音交互开辟了新道路。
(2)本文同时改善声学超材料薄板的设计、使用新研发的压电材料、结合摩擦发电或其他原理,帮助我们进一步提升声学超球面的传感特性。此外,通过选择合适的材料和微纳加工手段,声学超球面可以缩小尺寸,并保留相似的性能,以此将应用扩展到微纳机器人和健康监测领域。
参考文献:
Kejing Ma; Huyue Chen; Zhiyuan Wu; Xiangling Hao; Ge Yan; Wenbo Li; Lei Shao; Guang Meng; Wenming Zhang A wave-confining metasphere beamforming acoustic sensor for superior human-machine voice interaction
DOI:10.1126/sciadv.adc9230
https://www.science.org/doi/10.1126/sciadv.adc9230
版权声明:
本平台根据相关科技期刊文献、教材以及网站编译整理的内容,仅用于对相关科学作品的介绍、评论以及课堂教学或科学研究,不得作为商业用途。