江苏省自然科学基金(BK2012510)
- 作品数:17 被引量:47H指数:3
- 相关作者:张雄伟杨吉斌曾理李轶南贾冲更多>>
- 相关机构:解放军理工大学中国人民解放军西安通信学院南京陆军指挥学院更多>>
- 发文基金:江苏省自然科学基金国家自然科学基金中国博士后科学基金更多>>
- 相关领域:电子电信自动化与计算机技术更多>>
- 基于超高斯激励的噪声顽健语音线性预测分析算法
- 2013年
- 针对传统的语音信号线性预测分析算法在噪声环境下性能恶化的问题,提出了一种新的基于超高斯激励的噪声顽健线性预测算法。该算法采用具有超高斯特性的学生t分布对语音信号线性预测激励建模,并显式地考虑环境噪声的影响,从而构建语音信号线性预测分析的概率图模型。在此基础上,利用变分贝叶斯的方法求解模型参数的近似后验分布,进而实现对带噪语音线性预测系数的最优估计。实验结果表明,该算法能够有效提高噪声环境下语音信号线性预测分析的顽健性。
- 周彬邹霞张雄伟赵改华
- 字典学习和稀疏表示的无监督语音增强算法被引量:1
- 2014年
- 针对非结构噪声难以去除的问题,基于字典训练和稀疏表示提出一种无监督语音增强算法。该算法通过构造过完备字典并使用带噪语音样本对其进行训练来实现。首先指出K-奇异值分解算法(K-SVD)存在的不足并提出一种新的改进的字典训练算法:K-双边随机投影算法(K-BRP);然后使用K-BRP算法不断更新字典矩阵和相应的增益系数矩阵,从被非结构化噪声所污染的带噪语音中提取出结构性强的纯净语音。大量实验结果表明,由于训练样本考虑到了语音信号的时频域局部结构特征,所提算法能够很好地消除随机噪声,并且在低信噪比情况下仍然能够保持较高的语音质量和可懂度。
- 李轶南贾冲张立伟闵刚曾理
- 关键词:语音增强
- 基于字典学习的LSP参数稀疏表示及性能分析
- 2014年
- 为了研究LSP的稀疏表示方法,高效量化LSP参数,基于字典学习对LSP参数进行稀疏表示,并采用MOD和K-SVD算法训练参数字典,以平均谱失真和均方根误差为准则,通过仿真实验分析了算法的有效性,得出了字典学习时的稀疏度、原子个数等关键参数选取的原则。对比训练和测试LSP参数均方根误差性能曲线发现:随着稀疏度的增加,LSP参数字典外推能力增强,对训练集外参数稀疏表示性能恶化逐步减弱。
- 闵刚张雄伟杨吉斌陈砚圃
- 关键词:线谱对字典学习语音编码
- 改进的稀疏字典学习单通道语音增强算法被引量:12
- 2014年
- 基于K奇异值分解字典学习方法及其非负约束下的修改算法,本文提出一种改进的单通道语音增强算法。该算法将噪声划分为结构化噪声和非结构化噪声两部分。首先通过稀疏字典学习的方法对结构化噪声进行建模,训练出噪声字典;然后,使用所得噪声字典去除带噪语音中的结构化噪声;最后,采用过完备字典和稀疏表示的方法对纯净语音进行提取,去除非结构化噪声。实验结果表明,在平稳或非平稳噪声环境下,本文算法均能有效去除加性噪声,性能优于多带谱减法和基于非负稀疏编码的增强算法。
- 李轶南张雄伟曾理黄建军
- 关键词:语音增强字典学习
- 基于双因子高斯过程动态模型的声道谱转换方法被引量:3
- 2014年
- 针对作者已经提出的双因子高斯过程隐变量模型(Two-factorGaussianprocesslatentvariablemodel,TF-GPLVM)用于语音转换时未考虑语音的动态特征,并且模型训练时需要估计的参数较多的问题,提出引入隐马尔科夫模型(Hidden Markov model,HMM)对语音动态特征进行建模,并利用HMM隐状态对各帧语音进行关于语义内容的概率软分类,建立了分离精度更高、运算负荷较小的双因子高斯过程动态模型(Two-factor Gaussian process dynamic model,TF-GPDM).基于此模型,设计了一种全新的基于说话人特征替换的语音声道谱转换方案.主、客观实验结果表明,无论是与传统的统计映射和频率弯折转换方法相比,还是与双因子高斯过程隐变量模型方法相比,本文方法都获得了语音质量和转换相似度的提升,以及两项性能的更佳平衡.
- 孙新建张雄伟杨吉斌曹铁勇钟新毅
- 关键词:隐马尔科夫模型
- 稀疏卷积非负矩阵分解的语音增强算法被引量:13
- 2014年
- 鉴于卷积非负矩阵分解在语音增强算法中的成功应用,进一步考虑语音信号在时频域的稀疏性,提出了稀疏卷积非负矩阵分解(Sparse convolutive nonnegative matrix factorization,SCNMF)的语音增强算法。该算法包括训练和增强两个阶段。训练阶段通过SCNMF算法分别对纯净语音和噪声的频谱进行训练,得到纯净语音和噪声字典,并将其作为增强阶段的先验信息。增强阶段首先通过SCNMF算法对带噪语音的频谱进行分解,然后利用纯净语音和噪声联合字典以及相应的迭代公式对语音编码矩阵进行估计,重构增强语音。通过实验仿真分析了稀疏因子对增强语音质量的影响。实验结果表明,在非平稳噪声和低信噪比条件下,本文算法增强效果均优于多带谱减、非负矩阵分解和卷积非负矩阵分解等传统的算法。
- 张立伟贾冲张雄伟闵刚曾理
- 关键词:语音增强非负矩阵
- 基于压缩感知的K-L分解语音稀疏表示算法被引量:10
- 2013年
- 为克服稀疏基在KLT域不便传输的不足,提出一种基于Karhunen-Loeve(K-L)正交分解的语音稀疏表示算法。结合压缩感知理论,建立语音自相关模型并求解Fredholm积分方程,采用二分法估计出可实时传输的模型参数,构造非相干字典;然后用随机矩阵对语音在字典上的稀疏投影系数进行观测获得低维观测值。重构结果表明:相比已有的稀疏表示算法,本文算法的字典匹配性更好,且具有较好的语音质量。
- 曾理张雄伟陈亮杨吉斌贾冲
- 关键词:压缩感知
- 深度学习中对比散度算法的有偏性分析被引量:1
- 2015年
- 为了给对比散度算法的进一步优化提供理论指导,尝试从理论上分析对比散度算法的收敛性。首先从仅含4个结点的玻尔兹曼机入手,利用单纯形表征模型的概率空间,以及流形表征概率空间与模型参数的关系,形象地表示了对比散度算法和极大似然算法的收敛过程,并从理论上推导出对比散度算法的收敛集与极大似然算法的收敛集之差不为空,从而证明了对比散度算法的有偏性。基于该结论,设计了一种先利用对比散度算法进行预训练,再利用极大似然算法调优的训练策略。实验结果表明,在应用该策略获得同等收敛效果的条件下,训练迭代步骤降低了83.3%。
- 吴海佳张雄伟孙蒙杨吉斌
- 关键词:极大似然估计
- 改进的噪声鲁棒语音稀疏线性预测算法被引量:1
- 2014年
- 语音线性预测分析算法在噪声环境下性能会急剧恶化,针对这一问题,提出一种改进的噪声鲁棒稀疏线性预测算法。首先采用学生t分布对具有稀疏性的语音线性预测残差建模,并显式考虑加性噪声的影响以提高模型鲁棒性,从而构建完整的概率模型。然后采用变分贝叶斯方法推导模型参数的近似后验分布,最终实现噪声鲁棒的稀疏线性预测参数估计。实验结果表明,与传统算法以及近几年提出的基于l_1范数优化的稀疏线性预测算法相比,该算法在多项指标上具有优势,对环境噪声具有更好的鲁棒性,并且谱失真度更小,因而能够有效提高噪声环境下的语音质量。
- 周彬邹霞张雄伟
- 关键词:噪声环境语音质量稀疏性鲁棒性贝叶斯方法
- 稀疏低秩模型下的单通道自学习语音增强算法被引量:3
- 2014年
- 针对现有基于字典学习的增强算法依赖先验信息的问题,基于矩阵的稀疏低秩分解提出一种无监督的单通道语音增强算法。该算法首先通过稀疏低秩分解将带噪语音的幅度谱分解为低秩、稀疏和噪声3部分,然后通过对低秩部分进行自学习构建出噪声字典,最后利用所得噪声字典和乘性迭代准则于低秩和稀疏部分中分离出纯净语音。相较于其他基于字典学习的语音增强算法,本文所提算法无需语音或噪声的先验信息,因而更加方便和实用。实验结果显示,本文算法能够在保留语音谐波结构的同时有效抑制噪声,增强效果明显优于鲁棒主成分分析和多带谱减法。
- 李轶南贾冲杨吉斌吴海佳张立伟
- 关键词:语音增强无监督学习字典学习