行时频表示来构建直方图。其次,针对理想二进制时频掩码在分离时产生部分时频点丢失的问题,利用Gammatone
滤波器将二进制时频掩码进行平滑处理,从而更好的重建源。通过仿真结果表明,改进后的方法语音分离性能显
提。关键词:退化混合估计技术;参数估计;MCFT变换;Gammatone滤波器中图分类号:TN911 文献标识码:A0引言欠定盲源分离(undetermined blind source
separation, UBBS )是指在麦克风数量小于声源数量时,
叠。2016 年,Ferreira Alberta E. A.等人通过改进短
时傅里叶变换(shoC time Foucec transform, STFT)中的
大 的
键的 分,其估计的
了退化混合估计技术中语音分离的 量。了本的退化混合估计技术,从观测信号中恢复原始源信号,不必事先了解源的混 合过程。退化混合估计技术是由A. Jourjine等人[1]在
2000年提出的一种双通道欠定盲源分离技术。2004
不完 的 $混合参数估计是技术中 关
本「先
年,Y0maz 0等人旧通过大量实验证明了绝大多数语
针对技术的,用多分
的衰减-时延直方图,在分离
变换!multz -,采用Gammatone滤与音信号都近似满足W -不相关正交性,从而从理论上 对退化混合估计技术进行了完善。2007年, Rickard S[3]对其版本进行了进一步拓展,可以使用两
通道的混合 分离 数量的源, 提 了 的实$原始的退化混合估计技术在一定的resolution common fate transform, MCFT)创建混合参数
的 分离出源信号$ 本文改进
[5]中的改进
[4] 对比,通过 实验明,本文的进的 的提高了语音分离的, 中,
时频点在变换域内满足强 疏性 W-不量$相关正交性,数的估计不
的使用
,在源恢复的过程分时频点 $ 对以上 ,人对其进行了 种进。2011年,De Frein R等人⑷利用同步短时傅里叶变换(synchronized
shoC - time - Fouaec - transform, sSTFT)改善了低噪声
1原始的退化混合估计技术该技术采用消声混合模型,令!1( t)和!(\"表示
两个麦克风接收到的信号,#() 标第j个声源信号,
!的时本的相对数估计,实了分离性 的提高。Rafiz Z等人[5]通过 数Q变换! constant Q
transform, CQT)的时频表示建立直方图改善了峰值重分别 j个声源信号两麦克风的相对相对迟。对于N 声源信号,如下的表
达式:23基金项目:国家自然科学基金资助项目(No.51675286,No.61071198);浙江省重点科技创新团队资助项目(No.2013TD21)技术方案Tech no logy Scheme数据通信2019.3!( \" = ■
! . , S& t\"源j的二进制时频掩码。J \" 1,$
⑴8( \",#) = |1,9( \",#)== ⑺
如(t = ! % ( s&t -8J \"1 f!'-O,otherwise9(\",#):=语音信号s&tt通过加入窗函数w(t)进行傅里叶
变换可以表示为:S& \",#)= F [ S&(\",#) =
入
*
”+(t -\") &(t) e~'-dtarwmin I a % e\"s# ! ( \",#) - !\" ( \",#) I \"/ (1 +(% )(2)假设两个语音源信号& (t和& (t经过加窗傅里
⑻然后通过ML最大似然估计[2]来重建原始信号:s ( \", #) =8( \",#)((!1( \",#)+ ( e
叶变换后,在时频域上满足W -不相关正交性
(W - disjoint orthogonal, W - DO),即:s%\",#)s%\",#) = 0,
k
!2( \",#))/(1 + a%))(3)后通过时傅里叶变换,将
(9)
的时频域下通过式(3)可以推导出:在任意的时频点,至多只
有一个源占主导。那么通过构建二进制时频掩码,就
的源信号恢复到时域,就完 语音分离的过。可以将各个源分离出来。将麦克风接受到的信号通过ST9T变换到频域,然 后利用弋-不相关正交性可以得到:'!1(\",#)'二2退化混合估计技术的改进2.1 MCFT 变换混合分离 混合参数估 不 主
1 -_-L Q] € 1
1—8$由于STFT变换
J的,ST9T变换 用的时频窗口!2(\",#)-•- a$ e
的 ,每个时频域点有不一个源占主导时,通过ST9T变换 时频混 & MCFT变来 和表示时域L
-#.] &( \",#)
入⑷换 用一 二 的多分
制, 窗
每个时频域点的混合参数可以表示为:, 的 时频%( \",#)= 0 !2 ( \",#)/ !1 ( \",#)!(\",#)= ( - 1/#) & (!2(\",#)/ !1 ( \",#))⑸
混的 &时域信号!(t的MC9T变换如下所示閃:!(#,\")=将所有时频域点的混合参数绘制到直方图上,引
入权 参数 < 和=,得到加权直方图,
2(%,!)=『
()(。DEs,wS,R) 2* (s,其中,3 a,8) = '(\",#): | % (\",#) - a < &% |,| 8 (\ -
分
<&( , &%、&为相对衰减和相对时延取共紙(S,R)表示一组滤波器的中丿卜,EewS,R)
表示G(#,\";S,R)在中心(S,R)处的二维傅里叶变 换,2(&wS,R)表示滤波器组的脉冲响应,!,“S,
,3(,8)为属于某一声源的衰减-时延参数集合,%(\",#)和8 (\",#)分别表示局部衰减估计 和局部时估&直方图绘制完后,确定直方图所
表示整个范围内(S,R)的总和。2.2 Gammatone滤波器平滑的心坐标,以直方图
度,将
的欧式距离作为相似将 混合估 的 “0”用一个 的数 式:的 二进制掩码[8],掩码变 的的时频域点进行,建 声
24技术方案| /2019.3数据通信Technology Scheme |(11)$ ^otherwise其中,!为二值掩码矩阵,(表示时频点,这里令 $ ! 0.01 $0 1 2x105male-s3由于Gammatone滤波器组各个频段的作用规律不 同,则不同子带的作用系数也不同,其作用系数计算
如下:%(\"\"二「N/2-1
(b)分离的男声信号! 入 /
「N/2-1#=0! 1 o( \"# 1( # 1
#=0 (1*)(c)原始的女声信号o(1(#)|
0其中 0(
1! 01(
+3e °2( )/(1 + 3 ),female-slx1051 2x10501 2x105female-s2female-s3(#为第i个滤波器的频率响应,N是傅里叶变换的
(d)分离的女声信号图1原始信号与分离后的信号点数。计算出滤波器的作用系数后,就可以利用系数计
算出概率形式的掩膜,其表示如下:
!( \"# 二 !二%”)11(# 丨/!二丨1(# 进行对比仿真实验,其结果如下表1所示。表#原始退化混合估计技术与其改进算法的性能比较(dB)原始退化混合估
计技术7.15.16.98.9(13)分离信号的时频域表达计算如下e(\"# 二 730 !(\",#,$)o(\"#
SAR文献[4]的改进文献[5]的改进8.59.710.38.011.513.2((必)男最后通过多分辨率共同命运反变换,将提取的时 频域下的源信号恢复到时域,就实现了语音的分离 过程。声 信
本文的改进原始退化混合估
计技术12.56.99.83.98.79.6SDR文献[4]的改进文献[5]的改进8.45.06.510.111.910.912.4号
3仿真实验本实验用SiSEC2008&9]中“不确定语音和音乐混•
物”数
本文的改进原始退化混合估
计技术文献[4]的改进8.111.421.522.422.122.7SIR12.515.3文献[5]的改进本文的改进原始退化混合估
计技术文献[4]的改进24.225.424.825.99.4中的3个 语音信号和3个 语音信16.8&09.2号作为源信号 实验, 信号也 I7.2SiSEC2008,实验分别对原始退化 估计技术、文女SAR8.410.812.214.1文献[5]的改进本文的改进10.111.96.811.3献[4]、文献[5]和本文
的比较。算法 了 , 了12.87.28.9源信号的分离评价标准采用E. Vincent提出的
方法问,这 法 用。源信号 分离信号的波形如下图1所示。声 信
原始退化混合估
计技术文献[4]的改进8..7SDR8.09.7文献[5]的改进10.011.611.6本文的改进11.512.9号
原始退化混合估
计技术文献[4]的改进18.719.615.415.917.918.6SIRmale-sl
male-s2
male-s320.121.222.9文献[5]的改进21.523.1本文的改进19.5从表1可知,对比于文献[4]利用sSTFT变换进行
改进和文献[5]利用CQT变换
(a)原始的男声信号,本文的改进25技术方案Tech no logy Scheme数据通信2019.3方法在SAR、SIR和SDR各项指标上都要优于前两种 改进方法,因此,本文的改进方法可以更好的提高声源
信号的分离质量#$ 5 ] Rafii Y, Pardo B. Degenerate unmOing estirnation technique
using ie constani Q transform $ C ] // IEEEConference on Acoustics, Speech and Signal Processing,
2011, 125(3): 217 -220$ 6 ] Ferreira A E A, Alarcao D. Real - timc blind source
4结论本文讨论了欠定盲源分离中声源分离的问题,针
separationsystem wiii appmeaaons to distant speech recogni-
tion$0]. Applied AcousOcs, 2016, 113: 170 -184对原始退化混合估计技术中的参数估计不精确和分离 过程中时频点丢失的问题,提出了基于MCFT变换和
$ 7 ] Pishdadian F, Pardo B, Liutkus A. A Mulm - resoluion
approach to Common Fate - based audio separation $ C ] //
IEEE International Conference on AcousOcs, Speech and SognamPaoc2song.EEEE, 2017:566 -570平滑二进制掩膜的改进,通过对比实验证明了本文的
$ 8 [Kiiu C, Kumar K, Raj B, et al. Signal separation foe robust
speech recognition based on phase difference inforIml0on obtained in the frequence domain $ C ] // Conference of the International Speech Communication Association, 2009:2495 -2498改进可以更好的提高语音分离的性能,使该技术更具 有实用性。参考文献$ 1 ] Jourjine
A, Rickard S, Yilmaz 0. Blind separation of disjoint$ 9 ] Vincent E, Araki S, Bofill P. The 2008 0x101 separaton
evaluationcampaign: a comimmity - based approach te large - scale evaluation $ M] // Independent Component Analysis and
orthogonal signals: demising N sourcee from2 mixtures]C]// IREE Internationai Conference on Acoustics, Speech and Signai Processing, 2000 , 5 :2985 - 2988Signal SeparaOon. Spingee Berlin Heidelbera, 2009 : 734 -741$ 10] Emiya V, Vincent E, Harlandee N, e\" al. Subjectivv and
objeccvv quality assessment of audio source separation $ 0 ]-
$ 2 ] Yilmaz 0, Rickard S. Blind separation of speech mixtures vic
time - frequence masking $ 0 ] - IEEE TransacCons on signal
IEEE TransacCons on Audio Speech and Language Process
processing, 2004, 52(7) : 1830-1847$ 3 ] Rickard S. The DUET blind source separation almorieim
ing, 2011, 19(7):206 -2057$ M ] // Blind Speech Separation. Springer Netherlands,
2007:217 -241$ 4 ] De Frein R, Rickard S T. The synchronized short - tirne -
Fouriea - transform: properties and definitions foe multichan- nei source separain $ 0 ] - IEEE Transactions on Signal Processing, 2011, 59(1) : 91 - 103作者简介:陈斌杰(1993 -),男,硕士研究生,主要研究方向为语
音信号处理;陆志华(1983 -),男,博士,主要研究方向为阵列信 号处理;周宇(1960-),男,博士,教授,主要研究方向为网络与 信息安全;叶庆卫(1970-),男,博士,副教授,主要研究方向为 桥梁振动信号检测% ■简讯5G让远程医疗走向现实I中国信科助力完成
湖北省第一家医联体5G远程协同手术的重要时刻,上午9:20 市太和医院通过新一代5G通 技术成功实 医程 术。 市太和医院 通过程实时,指 在200 的 医院医 指,.利成 术,于10:15分 成术。程医 在 的 医,进优质医 源高 的,将大力提 医 平和 ,有 医题。中信 5G技术及应用的实践者和 ,积极与各行业合力探,本医 5G:程 术 5G,用的要实 一。本 医 5G远程 术 ,是基于“高速率、时延、容量”5G网络和充分运用“互 网+”健康医 新模式# 2019年 5 7 , 市太和医院中移动 司签订5G 医疗框 议,在中国移动、中信旗 唐移动等多方配合 ,用时一个 成5G网络搭建 调试、开通,本 术采用的5G网络实 了 术室 全范围覆盖、持续不断提供5G网络信号,采用 1080P摄像头高清播,全程画面清晰流畅无卡顿, 医实时交流和场指提供了近乎“面对面”的环境。时,太和医院医 成员单位通过基于5G的网络级全面推进“数字化”转型,实统一电子历和统一调度源。医院本部
6 6日,在 5G 用
及各分院均使用一 j电子历,分院的住院电子病历系统数据均集中存储在本部,实本部室对分院相关室的 管理。本部 可 9接实时查分院对 的患所有临床信息并接指诊治,并可实现精准的 转诊。分院医 员可9接查转诊本部的 的历 ,了解上级医院的治方,提高 的诊 平。通过统一的电子病历系统, 医 的临床 互互通,医质量的同质化管理,提升医联体的 能。基于5G 的医 转型”实了“数字多,: ”的转变。来源于:中国信科26
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- pqdy.cn 版权所有 赣ICP备2024042791号-6
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务