近场声源定位算法研究论文

文章 2019-07-13 10:25:50 1个回答   ()人看过

引言

近年来,基于麦克风阵列的声源定位技术快速发展,并且在多媒体系统,移动机器人,视频会议系统等方面有广泛的应用。例如,在军事方面,声源定位技术可以为雷达提供一个很好的补充,不需要发射信号,仅靠接收信号就可以判断目标的位置,因此,在定位的过程中就不会受到干扰和攻击。在视频会议中,说话人跟踪可为主意拾取和摄像机转向控制提供位置信息,使传播的图像和声音更清晰。声源定位技术因为其诸多优点以及在应用上的广泛前景成为了一个研究热点。

现有的声源定位方法主要分为三类:基于时延估计的定位方法、基于波束形成的定位方法和基于高分辨率空间谱估计的定位方法。基于时延估计的定位方法主要步骤是先进行时间差估计,也就是先计算声源分别到达两个麦克风的时间差,然后根据这个时间差和麦克风阵列的几何结构估计出声源的位置。该类方法的优点是计算量较小,容易实时实现,在单声源定位系统中已经得到广泛应用。基于波束形成的定位方法不需要直接计算时间差,而是通过对目标函数的优化直接实现声源定位。

但由于实际的应用环境中,目标函数往往存在多个极值点,因此如何优化复杂峰值的搜索过程就成为了一个重点。基于高分辨率的空间谱估计的声源定位算法,例如宽带的MUSIC方法和最大似然方法,因其可以同时定位多个声源并且具有比较高的空间分辨率,受到了广泛的关注。空间谱估计的方法源于阵列信号处理,其中的多重信号分类(MUSIC)算法在特定条件下具有很高的估计精度和分辨力,从而吸引了大量的学者对其进行深入的分析与研究。

但与阵列信号处理不同的是,在声源定位中,声源在大多数情况下是位于声源近场的。为了解决这一近场问题,许多学者针对传统的信号模型提出了改进算法,Asano等人将传统时域的MUSIC算法应用在频域中,提出了一种基于子空间的近场声源算法。下面来看一下近场的声源信号模型。

近场声源信号模型传统的阵列信号处理大多是基于远场模型的平面波信号的假设,但是在声源定位的实际应用中,有很多情况是处于声源近场的,例如视频会议,机器人仿真等。同时又由于麦克风阵列阵元拾音范围有限,更多的情况下定位也处于近场范围内,此时信源到达各麦克风阵元的信号应该是球面波,其衰减不是单一的常数,这种非线性决定了麦克风阵列声源定位的信号需要应用近场球面波模型。

假设M个全方向无差异的麦克风组成一个均匀直线阵列,麦克风阵元的间距为d,不妨设入射声源为点源,则P个入射声音信号S1,S2……,SP 各自的方位角以及距离参数为:(θ1,r1)(θ2,r2)……(θp,rp)。其中,θi为声源Si和阵列的参考点(阵列中心)之间的连线与麦克风阵列所在的直线之间的夹角,ri为声源Si与阵列的参考点之间的距离,i=1,2,…,P。则可以得出,第i个入射声源信号Si与第m个麦克风阵元之间距离为:r=,i=1,2,…,p (1)其中, dm为第m个麦克风阵元与阵列的参考点之间的距离, 且满足d=[m-(M+1)/2]d ,m=1,2,...,M (2)由此可得出,第i个入射声源信号到第m个阵元的距离与其到参考点的距离之差为△rmi=rmi-ri=-ri (3)从而可以得出第i个入射声源信号到达第m个麦克风阵元与其到达参考点的时间差为τmi=△rmi/c (4)其中,c为声音在空气中传播时的速度,这里取c=340 m/s。第m个麦克风阵元所接收到的来自第i个入射声源信号的信号为:y(t)=αe (5)其中, α是声源信号在传播中所产生的幅度衰减参数,在近场环境模型下,其值为α=ri/rmi=ri/ (6)当ri→∞时,α=1,即由近场模型转变为远场模型。对于P个入射信号,第m个麦克风所接收到的全部信号为:y(t)=αe+ni(t) (7) 由此可以得到,整个阵列所接收到的信号为:Y=HS+NY(t)=αe … αe … … …αe … αeS(t)+N(t) (8)其中,S(t)=(s1(t),s2(t),…,sp(t))T,N(t)=(n1(t),n2(t),…,np(t))T,H为空间阵列的M?觹P维的导向向量阵,即为入射信号的方向矢量。

MUSIC算法基本原理结合上面所介绍的数学模型(8),在条件理想的情况下,数学模型所在的空间中的信号子空间与其噪声子空间应该是相互正交的,那么信号子空间的导向矢量也应与其噪声子空间相互正交,即aH(θ)UN=0 (9)同时应该注意到,在实际接收中得到的数据矩阵长度是有限的,所以无法精确求得信号的数据协方差矩阵R。基于以上考虑,数据协方差矩阵的最大似然估计为:R`=XX (10)对上式特征值分解就可以得到噪声子空间的特征矢量矩阵U`N。

但是由于噪声的存在,U`N和aH(θ)并不能完全正交,这就导致式(9)不成立。因此,DOA的估计应该是通过搜索使aH(θ)U`N取最小值时的θ来实现的,所以可以定义MUSIC的谱估计公式为:PMUSIC= (11)只要对PMUSIC进行谱峰搜索,找出其极大值点对应的角度,就得到了信号入射的方向。3 实验结果与分析下面应用计算机仿真方法来验证前面的算法,仿真运用Matlab语言。实验中采取一维均匀直线阵,采用8个全向无差异的麦克风,在x轴上均匀分布,间距为10cm,取32ms为一帧,采样率设为16kHz进行数据处理。

选取汉明窗,窗长16ms,对输入信号进行实时的傅立叶变换。不同信噪比情况下,在不同角度上算法准确率的仿真结果如表1所示。从表1中可以看出,在信噪比为-5dB时,算法估计的准确率可以达到80%以上,在信噪比大于0dB时,算法估计准确率可达95%以上。在不同的信噪比下,定位算法所表现出的性能不同,随着信噪比的增加,其定位性能更加准确。

结束语

声源定位技术是目前研究的热点之一,可以广泛应用在生活,军事等领域中。此技术所要解决的问题是如何用可探测到的信号来对声源目标的位置进行估计。本文在构建了麦克风阵列近场模型的基础上,应用经典的MUSIC算法对空间中的声源进行定位。该算法先对接收到的矩阵进行频域预处理,然后利用MUSIC子空间的方法得到空间谱,再通过对得到的空间谱进行搜索,从而得到估计值。Matlab仿真结果表明,此算法拥有良好的定位性能,但在研究过程中发现此算法的复杂度比较高,如何减小算法的复杂度是下一步的研究工作。

顶一下 ()  踩一下 () 

 

本文标签:

[!--temp.ykpl--]


友情链接: