基于退化混合估计技术的改进

来源：品趣旅游知识分享网

2019.3数据通信Tech no logy Scheme IX技术方案| /基于退化混合估计技术的改进------------------------陈斌杰陆志华周宇叶庆卫(宁波大学信息科学与工程学院浙江宁波315211)摘要:退化混合估计技术是一种用于立体声音频的双通道欠定盲源分离方法。为了提高源信号的分离质量,对退化混合估计技术进行了改进。首先，针对混合参数估计不精确的问题，利用MCKT变换代替STKT变换进

行时频表示来构建直方图。其次,针对理想二进制时频掩码在分离时产生部分时频点丢失的问题，利用Gammatone

滤波器将二进制时频掩码进行平滑处理,从而更好的重建源。通过仿真结果表明，改进后的方法语音分离性能显

提。关键词:退化混合估计技术;参数估计;MCFT变换;Gammatone滤波器中图分类号:TN911 文献标识码：A0引言欠定盲源分离(undetermined blind source

separation, UBBS )是指在麦克风数量小于声源数量时,

叠。2016 年,Ferreira Alberta E. A.等人通过改进短

时傅里叶变换(shoC time Foucec transform, STFT)中的

大的

键的分，其估计的

了退化混合估计技术中语音分离的量。了本的退化混合估计技术,从观测信号中恢复原始源信号,不必事先了解源的混合过程。退化混合估计技术是由A. Jourjine等人［1］在

2000年提出的一种双通道欠定盲源分离技术。2004

不完的 $混合参数估计是技术中关

本「先

年,Y0maz 0等人旧通过大量实验证明了绝大多数语

针对技术的,用多分

的衰减-时延直方图,在分离

变换!multz -，采用Gammatone滤与音信号都近似满足W -不相关正交性，从而从理论上对退化混合估计技术进行了完善。2007年, Rickard S［3］对其版本进行了进一步拓展，可以使用两

通道的混合分离数量的源, 提了的实$原始的退化混合估计技术在一定的resolution common fate transform, MCFT)创建混合参数

的分离出源信号$ 本文改进

［5］中的改进

［4］对比，通过实验明,本文的进的的提高了语音分离的, 中，

时频点在变换域内满足强疏性 W-不量$相关正交性，数的估计不

的使用

，在源恢复的过程分时频点 $ 对以上，人对其进行了种进。2011年，De Frein R等人⑷利用同步短时傅里叶变换(synchronized

shoC - time - Fouaec - transform, sSTFT)改善了低噪声

1原始的退化混合估计技术该技术采用消声混合模型，令!1( t)和！(\"表示

两个麦克风接收到的信号，#() 标第j个声源信号,

!的时本的相对数估计，实了分离性的提高。Rafiz Z等人［5］通过数Q变换！ constant Q

transform, CQT)的时频表示建立直方图改善了峰值重分别 j个声源信号两麦克风的相对相对迟。对于N 声源信号，如下的表

达式：23基金项目：国家自然科学基金资助项目(No.51675286,No.61071198)；浙江省重点科技创新团队资助项目(No.2013TD21)技术方案Tech no logy Scheme数据通信2019.3!( \" = ■

! . , S& t\"源j的二进制时频掩码。J \" 1,$

⑴8( \",#) = |1,9( \"，#)== ⑺

如(t = ! % ( s&t -8J \"1 f!'-O,otherwise9(\",#):=语音信号s&tt通过加入窗函数w(t)进行傅里叶

变换可以表示为：S& \",#)= F [ S&(\",#) =

入

”+(t -\") &(t) e~'-dtarwmin I a % e\"s# ! ( \",#) - !\" ( \",#) I \"/ (1 +(% )(2)假设两个语音源信号& (t和& (t经过加窗傅里

⑻然后通过ML最大似然估计［2］来重建原始信号：s ( \", #) =8( \",#)((!1( \",#)+ ( e

叶变换后，在时频域上满足W -不相关正交性

(W - disjoint orthogonal, W - DO)，即:s%\",#)s%\",#) = 0,

!2( \",#))/(1 + a%))(3)后通过时傅里叶变换，将

(9)

的时频域下通过式(3)可以推导出:在任意的时频点,至多只

有一个源占主导。那么通过构建二进制时频掩码，就

的源信号恢复到时域，就完语音分离的过。可以将各个源分离出来。将麦克风接受到的信号通过ST9T变换到频域，然后利用弋-不相关正交性可以得到:'!1(\",#)'二2退化混合估计技术的改进2.1 MCFT 变换混合分离混合参数估不主

1 -_-L Q］ € 1

1—8$由于STFT变换

J的,ST9T变换用的时频窗口!2(\",#)-•- a$ e

的，每个时频域点有不一个源占主导时，通过ST9T变换时频混 & MCFT变来和表示时域L

-#.] &( \",#)

入⑷换用一二的多分

制, 窗

每个时频域点的混合参数可以表示为：, 的时频%( \",#)= 0 !2 ( \",#)/ !1 ( \",#)!(\",#)= ( - 1/#) & (!2(\",#)/ !1 ( \",#))⑸

混的 &时域信号!(t的MC9T变换如下所示閃:!(#,\")=将所有时频域点的混合参数绘制到直方图上，引

入权参数 < 和=,得到加权直方图，

2(%,!)=『

()(。DEs,wS,R) 2* (s,其中，3 a,8) = '(\",#): | % (\",#) - a < &% |,| 8 (\ -

分

<&( , &%、&为相对衰减和相对时延取共紙(S,R)表示一组滤波器的中丿卜，EewS,R)

表示G(#,\"；S,R)在中心(S,R)处的二维傅里叶变换，2(&wS,R)表示滤波器组的脉冲响应，！，“S,

,3(,8)为属于某一声源的衰减-时延参数集合，%(\",#)和8 (\",#)分别表示局部衰减估计和局部时估&直方图绘制完后,确定直方图所

表示整个范围内(S,R)的总和。2.2 Gammatone滤波器平滑的心坐标，以直方图

度，将

的欧式距离作为相似将混合估的 “0”用一个的数式:的二进制掩码[8],掩码变的的时频域点进行,建声

24技术方案| /2019.3数据通信Technology Scheme |(11)$ ^otherwise其中,!为二值掩码矩阵，(表示时频点，这里令 $ ! 0.01 $0 1 2x105male-s3由于Gammatone滤波器组各个频段的作用规律不同，则不同子带的作用系数也不同，其作用系数计算

如下：%(\"\"二「N/2-1

(b)分离的男声信号! 入 /

「N/2-1#=0! 1 o( \"# 1( # 1

#=0 (1*)(c)原始的女声信号o(1(#)|

0其中 0(

1! 01(

+3e °2( )/(1 + 3 ),female-slx1051 2x10501 2x105female-s2female-s3(#为第i个滤波器的频率响应,N是傅里叶变换的

(d)分离的女声信号图1原始信号与分离后的信号点数。计算出滤波器的作用系数后，就可以利用系数计

算出概率形式的掩膜，其表示如下：

!( \"# 二 !二％”)11(# 丨/!二丨1(# 进行对比仿真实验,其结果如下表1所示。表#原始退化混合估计技术与其改进算法的性能比较(dB)原始退化混合估

计技术7.15.16.98.9(13)分离信号的时频域表达计算如下e(\"# 二 730 !(\",#,$)o(\"#

SAR文献［4］的改进文献［5］的改进8.59.710.38.011.513.2((必)男最后通过多分辨率共同命运反变换,将提取的时频域下的源信号恢复到时域，就实现了语音的分离过程。声信

本文的改进原始退化混合估

计技术12.56.99.83.98.79.6SDR文献［4］的改进文献［5］的改进8.45.06.510.111.910.912.4号

3仿真实验本实验用SiSEC2008&9］中“不确定语音和音乐混•

物”数

本文的改进原始退化混合估

计技术文献［4］的改进8.111.421.522.422.122.7SIR12.515.3文献［5］的改进本文的改进原始退化混合估

计技术文献［4］的改进24.225.424.825.99.4中的3个语音信号和3个语音信16.8&09.2号作为源信号实验，信号也 I7.2SiSEC2008,实验分别对原始退化估计技术、文女SAR8.410.812.214.1文献［5］的改进本文的改进10.111.96.811.3献［4］、文献［5］和本文

的比较。算法了，了12.87.28.9源信号的分离评价标准采用E. Vincent提出的

方法问,这法用。源信号分离信号的波形如下图1所示。声信

原始退化混合估

计技术文献［4］的改进8..7SDR8.09.7文献［5］的改进10.011.611.6本文的改进11.512.9号

原始退化混合估

计技术文献［4］的改进18.719.615.415.917.918.6SIRmale-sl

male-s2

male-s320.121.222.9文献［5］的改进21.523.1本文的改进19.5从表1可知，对比于文献［4］利用sSTFT变换进行

改进和文献［5］利用CQT变换

(a)原始的男声信号，本文的改进25技术方案Tech no logy Scheme数据通信2019.3方法在SAR、SIR和SDR各项指标上都要优于前两种改进方法，因此，本文的改进方法可以更好的提高声源

信号的分离质量#$ 5 ] Rafii Y, Pardo B. Degenerate unmOing estirnation technique

using ie constani Q transform $ C ] // IEEEConference on Acoustics, Speech and Signal Processing,

2011, 125(3): 217 -220$ 6 ] Ferreira A E A, Alarcao D. Real - timc blind source

4结论本文讨论了欠定盲源分离中声源分离的问题，针

separationsystem wiii appmeaaons to distant speech recogni-

tion$0]. Applied AcousOcs, 2016, 113： 170 -184对原始退化混合估计技术中的参数估计不精确和分离过程中时频点丢失的问题，提出了基于MCFT变换和

$ 7 ] Pishdadian F, Pardo B, Liutkus A. A Mulm - resoluion

approach to Common Fate - based audio separation $ C ] //

IEEE International Conference on AcousOcs, Speech and SognamPaoc2song.EEEE, 2017:566 -570平滑二进制掩膜的改进,通过对比实验证明了本文的

$ 8 [Kiiu C, Kumar K, Raj B, et al. Signal separation foe robust

speech recognition based on phase difference inforIml0on obtained in the frequence domain $ C ] // Conference of the International Speech Communication Association, 2009:2495 -2498改进可以更好的提高语音分离的性能,使该技术更具有实用性。参考文献$ 1 ] Jourjine

A, Rickard S, Yilmaz 0. Blind separation of disjoint$ 9 ] Vincent E, Araki S, Bofill P. The 2008 0x101 separaton

evaluationcampaign: a comimmity - based approach te large - scale evaluation $ M] // Independent Component Analysis and

orthogonal signals： demising N sourcee from2 mixtures]C]// IREE Internationai Conference on Acoustics, Speech and Signai Processing, 2000 , 5 ：2985 - 2988Signal SeparaOon. Spingee Berlin Heidelbera, 2009 : 734 -741$ 10] Emiya V, Vincent E, Harlandee N, e\" al. Subjectivv and

objeccvv quality assessment of audio source separation $ 0 ]-

$ 2 ] Yilmaz 0, Rickard S. Blind separation of speech mixtures vic

time - frequence masking $ 0 ] - IEEE TransacCons on signal

IEEE TransacCons on Audio Speech and Language Process

processing, 2004, 52(7) : 1830-1847$ 3 ] Rickard S. The DUET blind source separation almorieim

ing, 2011, 19(7):206 -2057$ M ] // Blind Speech Separation. Springer Netherlands,

2007：217 -241$ 4 ] De Frein R, Rickard S T. The synchronized short - tirne -

Fouriea - transform: properties and definitions foe multichan- nei source separain $ 0 ] - IEEE Transactions on Signal Processing, 2011, 59(1) : 91 - 103作者简介:陈斌杰(1993 -)，男，硕士研究生，主要研究方向为语

音信号处理；陆志华(1983 -),男，博士，主要研究方向为阵列信号处理;周宇(1960-),男，博士，教授，主要研究方向为网络与信息安全;叶庆卫(1970-),男，博士，副教授，主要研究方向为桥梁振动信号检测％ ■简讯5G让远程医疗走向现实I中国信科助力完成

湖北省第一家医联体5G远程协同手术的重要时刻，上午9:20 市太和医院通过新一代5G通技术成功实医程术。市太和医院通过程实时，指在200 的医院医指,.利成术，于10:15分成术。程医在的医，进优质医源高的，将大力提医平和，有医题。中信 5G技术及应用的实践者和，积极与各行业合力探，本医 5G：程术 5G,用的要实一。本医 5G远程术，是基于“高速率、时延、容量”5G网络和充分运用“互网+”健康医新模式# 2019年 5 7 , 市太和医院中移动司签订5G 医疗框议，在中国移动、中信旗唐移动等多方配合 ,用时一个成5G网络搭建调试、开通，本术采用的5G网络实了术室全范围覆盖、持续不断提供5G网络信号，采用 1080P摄像头高清播,全程画面清晰流畅无卡顿，医实时交流和场指提供了近乎“面对面”的环境。时，太和医院医成员单位通过基于5G的网络级全面推进“数字化”转型,实统一电子历和统一调度源。医院本部

6 6日，在 5G 用

及各分院均使用一 j电子历，分院的住院电子病历系统数据均集中存储在本部,实本部室对分院相关室的管理。本部可 9接实时查分院对的患所有临床信息并接指诊治，并可实现精准的转诊。分院医员可9接查转诊本部的的历，了解上级医院的治方，提高的诊平。通过统一的电子病历系统，医的临床互互通，医质量的同质化管理,提升医联体的能。基于5G 的医转型”实了“数字多，： ”的转变。来源于：中国信科26

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文