闵刚 作品数:27 被引量:73 H指数:6 供职机构: 解放军理工大学 更多>> 发文基金: 国家自然科学基金 江苏省自然科学基金 更多>> 相关领域: 电子电信 自动化与计算机技术 理学 军事 更多>>
改进的非负矩阵分解语音增强算法 被引量:7 2015年 本文提出了一种改进的非负矩阵分解语音增强算法,该算法可分为训练和增强两部分。首先,为了降低训练复杂度,采用卷积非负矩阵分解只提取噪声字典。增强时,考虑语音信号稀疏性比噪声信号稀疏性强,通过稀疏非负矩阵分解重构出语音幅度谱,采用交替方向乘子法进行优化迭代,克服了经典乘性迭代易陷入局部最优、分母只能收敛到零极限等问题。最后,基于算法融合的思想,将重构的语音幅度谱与谱减法、最小均方误差幅度谱估计得到的幅度谱进行加权融合。仿真实验中,在10种不同噪声环境中,通过多种评价标准证明所提算法能取得较好的增强效果。 胡永刚 张雄伟 邹霞 闵刚 郑云飞 李莉 石佳佳一种200/300bps超低速率声码器算法 为了适应短波、卫星通信等应用,提出了一种平均编码速率为200bps和300bps的超低速率声码器算法。该算法吸收分段声码器和MELP算法的优点,建立了混合激励分段语音编码模型。利用一种改进的语音分段算法,提高了分段准确性... 闵刚 蒋永生 张雄伟 杨吉斌关键词:语音编码 语音分段 矢量量化 文献传递 字典学习和稀疏表示的无监督语音增强算法 被引量:1 2014年 针对非结构噪声难以去除的问题,基于字典训练和稀疏表示提出一种无监督语音增强算法。该算法通过构造过完备字典并使用带噪语音样本对其进行训练来实现。首先指出K-奇异值分解算法(K-SVD)存在的不足并提出一种新的改进的字典训练算法:K-双边随机投影算法(K-BRP);然后使用K-BRP算法不断更新字典矩阵和相应的增益系数矩阵,从被非结构化噪声所污染的带噪语音中提取出结构性强的纯净语音。大量实验结果表明,由于训练样本考虑到了语音信号的时频域局部结构特征,所提算法能够很好地消除随机噪声,并且在低信噪比情况下仍然能够保持较高的语音质量和可懂度。 李轶南 贾冲 张立伟 闵刚 曾理关键词:语音增强 基于扩频的音频信息隐藏算法的性能分析 被引量:1 2010年 基于扩频的音频隐藏算法一般都采用阈值相关法进行检测,但感知整形过程往往会破坏伪随机序列的正交性。为削弱盲提取时原始载体信号所导致相关噪声的影响,通过分析音频信号、伪随机序列和信道的统计特性,推导出接收信号的数学期望和方差,并给出了正确检测时各参数间的约束关系。最后,通过仿真实验验证了以上结论的正确性。 马文君 陈砚圃 高悦 闵刚关键词:扩频 音频信号 伪随机序列 分段声码器中的语音分段算法研究 分段声码器是一种高效的低速语音编码方法,在低于600bps极低速率语音编码领域占据重要地位。文中针对分段声码器实现的关键技术语音分段方法进行了研究,提出了一种分段新算法。该算法定义了一种新的距离侧度──夹角距离,在此基础... 闵刚 蒋永生 杨吉斌 张雄伟关键词:语音分段 动态规划 低速语音编码 文献传递 用于无监督语音降噪的听觉感知鲁棒主成分分析法 被引量:4 2017年 针对现有稀疏低秩分解语音降噪方法对人耳听觉感知特性应用不充分、语音失真易被感知的问题,提出了一种用于语音降噪的听觉感知鲁棒主成分分析法。由于耳蜗基底膜对于频率感知具有非线性特性,该方法采用耳蜗谱图作为语噪分离的基础。此外,选用符合人耳听觉感知特性的板仓-斋田距离度量作为优化目标函数,在稀疏低秩建模过程中引入非负约束以使分解分量更符合实际物理含义,并在交替方向乘子法框架下推导了具有闭合解形式的迭代优化算法。文中方法在语音降噪时是完全无监督的,无需预先训练语音或噪声模型。多种类型噪声和不同信噪比条件下的仿真实验验证了该方法的有效性,噪声抑制效果较目前同类算法更为显著,且降噪后语音的可懂度和总体质量有所提高、至少相当。 闵刚 邹霞 韩伟 张雄伟 谭薇关键词:主成分分析法 语音降噪 听觉感知 鲁棒 噪声模型 基于字典学习的LSP参数稀疏表示及性能分析 2014年 为了研究LSP的稀疏表示方法,高效量化LSP参数,基于字典学习对LSP参数进行稀疏表示,并采用MOD和K-SVD算法训练参数字典,以平均谱失真和均方根误差为准则,通过仿真实验分析了算法的有效性,得出了字典学习时的稀疏度、原子个数等关键参数选取的原则。对比训练和测试LSP参数均方根误差性能曲线发现:随着稀疏度的增加,LSP参数字典外推能力增强,对训练集外参数稀疏表示性能恶化逐步减弱。 闵刚 张雄伟 杨吉斌 陈砚圃关键词:线谱对 字典学习 语音编码 一种采用混合激励的超低速率分段声码器 被引量:3 2009年 为满足通信和多媒体存储对超低速语音编码的要求,提出了一种平均编码速率为200和300 bps的超低速率声码器算法。结合分段声码器和M ELP算法的优点,该算法对语音建立了混合激励分段编码模型。提出了线谱对参数的变维矩阵量化和激励参数的变维矢量量化方案,在超低速率条件下获得了较好的量化效果,同时有效地降低了码本存储量。非正式主观听力测试表明:编码速率为300 bps时,重建语音保持了较高的可懂度和一定的自然度;编码速率为200 bps时,语音质量仍可以接受。 闵刚 张雄伟 杨吉斌 安云峰关键词:语音编码 矢量量化 语音分段 ADMM稀疏非负矩阵分解语音增强算法 被引量:2 2016年 提出一种基于交替方向乘子法的(Alternating Direction Method of Multipliers,ADMM)稀疏非负矩阵分解语音增强算法,该算法既能克服经典非负矩阵分解(Nonnegative Matrix Factorization,NMF)语音增强算法存在收敛速度慢、易陷入局部最优等问题,也能发挥ADMM分解矩阵具有的强稀疏性。算法分为训练和增强两个阶段:训练时,采用基于ADMM非负矩阵分解算法对噪声频谱进行训练,提取噪声字典,保存其作为增强阶段的先验信息;增强时,通过稀疏非负矩阵分解算法,从带噪语音频谱中对语音字典和语音编码进行估计,重构原始干净的语音,实现语音增强。实验表明,该算法速度更快,增强后语音的失真更小,尤其在瞬时噪声环境下效果显著。 胡永刚 张雄伟 邹霞 闵刚 张立伟 王健关键词:语音增强 稀疏卷积非负矩阵分解的语音增强算法 被引量:13 2014年 鉴于卷积非负矩阵分解在语音增强算法中的成功应用,进一步考虑语音信号在时频域的稀疏性,提出了稀疏卷积非负矩阵分解(Sparse convolutive nonnegative matrix factorization,SCNMF)的语音增强算法。该算法包括训练和增强两个阶段。训练阶段通过SCNMF算法分别对纯净语音和噪声的频谱进行训练,得到纯净语音和噪声字典,并将其作为增强阶段的先验信息。增强阶段首先通过SCNMF算法对带噪语音的频谱进行分解,然后利用纯净语音和噪声联合字典以及相应的迭代公式对语音编码矩阵进行估计,重构增强语音。通过实验仿真分析了稀疏因子对增强语音质量的影响。实验结果表明,在非平稳噪声和低信噪比条件下,本文算法增强效果均优于多带谱减、非负矩阵分解和卷积非负矩阵分解等传统的算法。 张立伟 贾冲 张雄伟 闵刚 曾理关键词:语音增强 非负矩阵