您的位置: 专家智库 > >

陕西省自然科学基金(2012JM1010)

作品数:6 被引量:14H指数:2
相关作者:曾向阳王强王征王曙光万书婷更多>>
相关机构:西北工业大学中国船舶工业集团公司中国科学院更多>>
发文基金:陕西省自然科学基金国家自然科学基金西北工业大学研究生创业种子基金更多>>
相关领域:电子电信理学一般工业技术交通运输工程更多>>

文献类型

  • 6篇期刊文章
  • 1篇会议论文

领域

  • 3篇电子电信
  • 2篇自动化与计算...
  • 2篇一般工业技术
  • 2篇理学
  • 1篇交通运输工程

主题

  • 3篇混响
  • 2篇语音
  • 2篇水下目标
  • 2篇水下目标识别
  • 2篇目标识别
  • 1篇倒谱
  • 1篇动态核
  • 1篇音调
  • 1篇音乐检索
  • 1篇隐马尔可夫模...
  • 1篇语音识别
  • 1篇语音转换
  • 1篇声学
  • 1篇声源
  • 1篇声源定位
  • 1篇视听
  • 1篇双传声器
  • 1篇说话人识别
  • 1篇特征提取
  • 1篇特征提取方法

机构

  • 7篇西北工业大学
  • 1篇中国科学院
  • 1篇中国船舶工业...

作者

  • 7篇曾向阳
  • 3篇王强
  • 1篇王曙光
  • 1篇李志锋
  • 1篇乔宇
  • 1篇李娜
  • 1篇王征
  • 1篇王蕾
  • 1篇万书婷

传媒

  • 2篇电声技术
  • 1篇西北工业大学...
  • 1篇声学学报
  • 1篇兵工学报
  • 1篇声学技术

年份

  • 4篇2015
  • 1篇2014
  • 1篇2013
  • 1篇2012
6 条 记 录,以下是 1-7
排序方式:
混响环境中的视-听语音识别被引量:3
2012年
针对混响环境中语音识别率相对安静环境下急剧下降的问题,提出了一种将语音视觉信息与音频特征相结合的方法。通过快速检测和定位包含说话人唇部的感兴趣区域(ROI),获得ROI图像序列。首先对ROI图像进行离散余弦变换,提取反映说话人唇动的视觉特征。音频特征的提取,则采用较为成熟的Mel频率倒谱系数(MF-CC)方法。对所获取的视、音特征采用隐马尔可夫模型作为训练识别算法。测试实验结果证明,采用视、听特征相结合的方法,有效地提高了混响环境中的语音识别率。
万书婷曾向阳王强
关键词:语音识别混响隐马尔可夫模型
基于上升过零点检测的室内双传声器声源定位
2014年
提出了一种基于上升过零点检测的双传声器声源定位方法,该方法可以根据双传声器信号时间差样本的统计特性求得信噪比,再统计满足信噪比要求的可靠时间差样本,将其转换成对应的方位角样本,最后根据样本数量的统计分析结果确定声源方位。针对不同声源、信噪比及混响条件,在实际房间中进行了定位实验。结果显示:该方法对宽带声源具有更好的定位效果;定位精度受信噪比的影响很小,但受室内混响的影响显著。
曾向阳蔡怀珍
关键词:过零点检测混响
水下目标的Gammatone子带降噪和希尔伯特-黄变换特征提取被引量:7
2015年
水下目标识别是水声探测中的关键技术,具有重要的应用价值。海洋环境的复杂性导致水下目标识别中存在不可回避的噪声干扰。以人耳听觉机理为基础,提出了一种结合Gammatone滤波器、小波阈值降噪和希尔伯特-黄变换(HHT)的水下目标识别方法。采用Gammatone滤波器实现人耳听觉机理的模拟,并在此基础上进行小波阈值降噪,提高系统的噪声鲁棒性,然后利用HHT进行时频分析和特征提取。利用实际水下目标数据进行识别实验,对提出的方法进行了验证。实验结果表明,提出的方法在低信噪比条件下具有良好的鲁棒性,并具有较好的识别效果。
王曙光曾向阳王征王强
关键词:声学水下目标识别希尔伯特-黄变换
基于音调转换的哼唱检索特征提取方法
基于内容的音乐检索是当前语音识别领域的一个研究热点。本文提出一种基于音乐特征的哼唱检索方法,该方法以基频和音调作为特征参数,首先计算信号的基频向量,然后对基频进行调式转化,根据转化后的频率计算音调向量,再用基频和音调构成...
曾向阳王蕾
关键词:基频音调音乐检索特征提取
文献传递
用于室内环境说话人识别的混响补偿方法
2015年
针对训练和识别环境不同而导致室内说话人识别系统识别率显著下降的问题,提出了一种基于差异化特征提取的混响补偿方法。与使用传统MFCC特征的识别阶段不同,该方法在训练阶段通过Schroeder反向积分在mel频带获得房间声能量衰减曲线,并使用该曲线补偿纯净信号的MFCC特征,以模拟实际室内混响场声信号特征;同时,通过联合应用相对谱滤波(RASTA)与倒谱均值规整(CMN)处理MFCC特征,进一步抑制房间通道效应对语音信号影响。针对不同混响程度房间中实测数据的识别结果表明,该方法可以显著提高识别率,具有良好的抑制混响作用。
曾向阳王强
关键词:混响房间脉冲响应说话人识别
一种视听融合的水下目标识别方法研究被引量:2
2015年
特征提取是水下目标识别研究中最为关键的技术之一,特征参数的优劣将直接决定分类识别系统的性能。将声信号的听觉与视觉感知特征结合,应用于水下目标识别,通过实验得出如下结论,相比于单独应用听觉特征,融合特征的平均识别率能提高4%~6%以上,特别是将听觉特征与声谱图的Gabor小波变换特征、灰度-梯度共生特征进行融合后,分类性能较好,平均达到87%以上。
马理想曾向阳
关键词:水下目标识别可视化图像特征
采用动态核特征及贝叶斯最大后验估计的语音转换方法被引量:2
2015年
针对小样本情况下,使用混合概率线性回归(Mixture of Probabilistic Linear Regressions,MPLR)模型进行语音转换容易出现过拟合的问题,提出利用动态核特征替代源说话人语音谱特征后,对转换函数参数进行贝叶斯最大后验估计(Maximum a Posterior,MAP)求解的方法。首先采用核函数将源说话人的语音谱特征转化为动态核特征,再引入转换函数参数的先验知识,最后根据对误差的不同假设,提出两种求解转换函数参数的方法。客观评测实验结果表明,所提出方法的平均谱失真值相对于MPLR模型转换方法平均降低了4.25%。主观评测实验结果表明,所提出的方法在转换语音的相似度和自然度方面的得分均高于MPLR方法。实验结果证明,所提出方法有效地改善了语音转换中的过拟合问题。
李娜曾向阳乔宇李志锋
关键词:最大后验估计语音转换谱特征动态核贝叶斯函数参数
共1页<1>
聚类工具0