您的位置: 专家智库 > >

国家自然科学基金(61071215)

作品数:14 被引量:44H指数:4
相关作者:赵鹤鸣潘欣裕陶智余耀陈雪勤更多>>
相关机构:苏州大学苏州科技学院更多>>
发文基金:国家自然科学基金苏州市科技发展计划苏州市科技计划项目(应用基础研究计划)更多>>
相关领域:电子电信自动化与计算机技术理学医药卫生更多>>

文献类型

  • 14篇期刊文章
  • 1篇会议论文

领域

  • 10篇电子电信
  • 4篇自动化与计算...
  • 1篇交通运输工程
  • 1篇医药卫生
  • 1篇理学

主题

  • 8篇语音
  • 4篇耳语音
  • 2篇语音增强
  • 2篇噪声
  • 2篇说话人识别
  • 2篇混沌
  • 2篇高斯
  • 2篇CONVER...
  • 1篇点检测算法
  • 1篇端点
  • 1篇端点检测
  • 1篇端点检测算法
  • 1篇心电
  • 1篇心电信号
  • 1篇信道
  • 1篇性能指标
  • 1篇隐藏信息
  • 1篇映射
  • 1篇语音端点检测
  • 1篇语音信道

机构

  • 8篇苏州大学
  • 2篇苏州科技学院

作者

  • 8篇赵鹤鸣
  • 2篇陶智
  • 2篇潘欣裕
  • 1篇周强
  • 1篇顾济华
  • 1篇陈雪勤
  • 1篇陈小平
  • 1篇吕岗
  • 1篇吴俊
  • 1篇周成燕
  • 1篇许宜申
  • 1篇张晓俊
  • 1篇吴迪
  • 1篇顾晓江
  • 1篇朱伟芳
  • 1篇余耀

传媒

  • 6篇Chines...
  • 3篇声学学报
  • 1篇物理学报
  • 1篇数据采集与处...
  • 1篇计算机工程与...
  • 1篇应用科学学报
  • 1篇信号处理

年份

  • 1篇2016
  • 2篇2014
  • 3篇2013
  • 5篇2012
  • 3篇2011
  • 1篇2010
14 条 记 录,以下是 1-10
排序方式:
中文耳语元音的声调特征研究被引量:3
2011年
声带准周期振动的缺失,使得汉语耳语音成为了一种特殊的发音模式,也使得耳语声调无法用基音周期表征。目前用于语音识别和声纹识别的常规语音特征,包含声调信息较少,所以在声调识别实验中很难获得良好的效果。本文提出一种新的特征参数来模拟正常语音的基频声调轨迹,即以人的听觉特性为出发点,研究人的声调敏感Bark频带,发现部分扩散Bark谱能量归一化比例拟合曲线,能够呈现出类似正常语音的基频轨迹,这说明在某些方面该轨迹或多或少包含了耳语音的声调信息。在以该轨迹和语音短时能量曲线为特征,以神经网络为模型的耳语声调识别实验中获得了较高的识别正确率,汉语四声的总体识别正确率高达78%,这也为对耳语音的进一步处理提供了很多有力依据。
潘欣裕赵鹤鸣
关键词:耳语音声调
Research of whispered speech vocal tract system conversion based on universal background model and effective Gaussian components被引量:1
2013年
Directing to the weakness of the present fixed values mapping methods(method_F),a vocal tract system conversion method based on the universal background model(UBM) is proposed for improving the performance of the speech conversion system from Chinese whispered speech to normal speech.For the numerous components of UBM,the errors produced by the acoustical probability density statistical model can't be ignored.Thus an effective Gaussian mixture components chosen method based on the posterior probability summation of the minimum spectral distortion is developed to optimizing the system performance.The proposed method(method_U) is analyzed and compared using the performance index(PI) based on Itakura-Saito spectral distortion measure.It is shown experimentally that the performance of method_U is more stability for different speakers and different phonemes than that of method_F.The average PI of method-U is better than method_F.It is shown that by selecting effective Gaussian mixture components,the PI of method_U can be further improved 5.11%.Subjective auditory tests also show that the proposed method can improve the definition and intelligibility of conversion speech.
CHEN XueqinZHAO Heming
关键词:高斯混合耳语音
基于约束方差的噪声谱估计算法被引量:2
2012年
为了进一步提高非平稳环境下噪声估计的准确性,提出了一种基于约束方差的噪声谱估计算法,通过约束方差计算得出平滑参数,对噪声功率谱进行估计。实验结果表明,相对于其他三种算法,该算法能较低时延地跟踪背景噪声的轨迹,且它的噪声谱估计均方误差较小,在非平稳噪声及噪声突变环境下尤为明显。
周成燕周强顾济华赵鹤鸣陶智
关键词:约束方差语音增强
利用经验模态分解的QRS综合波检测
2010年
在分析心电信号能量分布特点基础上,利用经验模态分解(EMD)方法的自适应数据分析特性提出了一种QRS综合波检测方案.采用完全数据驱动的EMD方法将心电信号分解成一组内蕴模式函数(IMFs).求取各内蕴模式函数的能量并归一化,根据能量分布的特点确定信号是否存在电平整体偏置、基线漂移、高大T波等影响QRS综合波检测的因素,并采取相应的抑制措施.然后以较简单的可调阈值进行判定,并采取一系列防错检、防漏检措施来准确定位QRS综合波.采用MIT-BIH Arrythmia Database对该方法进行了验证,平均正确检测率高达99.91%.结果表明,该方法是一种高效的QRS综合波检测算法.
朱伟芳赵鹤鸣陈小平
关键词:心电信号QRS综合波经验模态分解
有效高斯分量通用背景模型下耳语音声道系统转换研究被引量:5
2013年
为了改善耳语音转换中声道系统的转换性能,针对定值转换方法在非特定人耳语音转换系统中效果不理想的情况,提出使用通用背景模型建立独立于说话人的声道系统转换模型。进一步针对在通用背景模型中由于较大分量数产生的声学概率密度统计模型的误差问题,提出基于最小谱失真度的后验概率和有效高斯分量选择方法优化特征矢量的转换性能。定义了板仓一斋田谱失真测度的性能指标对该模型进行分析比较,实验表明,基于通用背景模型的转换特征矢量平均谱失真度性能指标优于定值偏移方法,且稳定性明显好于定值偏移方法。通用背景模型基础上有效高斯分量选择方法可进一步将性能指标提高5.11%,主观听觉测试表明本文方法可改善转换语音的清晰度和准确度。
陈雪勤赵鹤鸣
关键词:耳语音声道高斯性能指标特征矢量
模型与特征混合补偿法及其在耳语说话人识别中的应用被引量:4
2012年
为了提高信道差异下短时耳语说话人的识别率,提出了一种在模型域和特征域进行混合补偿的方法。该方法首先在模型训练阶段以联合因子分析法为基础,通过估计训练语音的说话人空间和信道空间,提取出说话人因子,消除信道因子,其次在测试阶段,将测试语音的信道因子映射到特征空间,实施特征补偿,从而在模型和特征两方面去除信道信息,提高识别率。实验结果显示,在三种不同的信道训练环境下,混合补偿法都取得了相似的识别率,且新方法对短时耳语音的测试效果要优于联合因子分析法。
顾晓江赵鹤鸣吕岗
关键词:说话人识别特征域补偿法
Conversion from whispered speech to normal speech using the extended bilinear transformation method被引量:1
2013年
A method of conversion from whispered speech to normal speech using the extended bilinear transformation was proposed.On account of the different deviation degrees of the whisper's formants in different frequency bands,the spectrum of the whispered speech will be processed in the separate partitions of this paper.On the basis of this spectrum,we will establish a conversion function able to usefully convert whispered speech to normal speech.Because of the whisper's non-linear offset in relation to normal speech,this paper introduces an expansion factor in the bilinear transform function making it correspond more closely to the actual conversion demands of whispered speech to normal speech.The introduction of this factor takes the non-linear move of the spectrum and the compression of the formant bandwidth into consideration,thus effectively reducing the spectrum distortion distance in the conversion.The experiment results show that the conversion presented in this paper effectively improves both the sound quality and the intelligibility of whispered speech.
TAO ZhiZHAO HemingTAN XuedanGU JihuaZHANG XiaojunWU Di
关键词:双线性变换法语音转换耳语音
Whispered speaker identification based on feature and model hybrid compensation被引量:1
2012年
In order to increase short time whispered speaker recognition rate in variable channel conditions,the hybrid compensation in model and feature domains was proposed.This method is based on joint factor analysis in training model stage.It extracts speaker factor and eliminates channel factor by estimating training speech speaker and channel spaces.Then in the test stage,the test speech channel factor is projected into feature space to engage in feature compensation,so it can remove channel information both in model and feature domains in order to improve recognition rate.The experiment result shows that the hybrid compensation can obtain the similar recognition rate in the three different training channel conditions and this method is more effective than joint factor analysis in the test of short whispered speech.
GU Xiaojiang ZHAO Heming Lu Gang
关键词:说话人识别语音信道识别率
A method of whispered speech enhancement based on speech absence probability and modified mel-domain masking model
2011年
用听觉的掩盖的低声说的讲话改进在修改 Mel- 的模型领域和讲话缺席概率树液被建议。考虑到发声字符 -- 耳语的 acteristic,我们修改可伸缩的 Mel 频率模型。低声说的讲话被建议模型过滤。同时,为每个频率乐队掩盖阀值的价值被讲话缺席概率动态地决定。然后低声说的讲话改进被适应地用不同掩盖的阀值价值修正光谱减法系数进行。提高的低声说的信号上的客观、主观的测试的结果与另外的方法相比显示出那;建议方法能由在掩盖的阀值价值下面减少音乐噪音和背景噪音与更好主观的听觉的质量和更少的失真提高低声说的信号。
TAO Zhi~(1,2) ZHAO Heming~2 WU Di~1 CHEN Daqing~1 ZHANG Xiaojun~1 (1 School of Physical Science and Technology,Soochow University Suzhou 215006) (2 School of Electronics and Information Engineering,Soochow University Suzhou 215006)
关键词:语音增强听觉掩蔽
Vocal Tract Modeling in 1D and 2D Digital Waveguide Methods
The digital waveguide method is a technique commonly used in the modeling of room acoustics and musical instru...
Yao JuHeming Zhao
共2页<12>
聚类工具0