黑龙江省留学归国人员基金(LC03C10)
- 作品数:3 被引量:16H指数:3
- 相关作者:韩纪庆李海峰王欢良郑铁然更多>>
- 相关机构:哈尔滨工业大学更多>>
- 发文基金:国家自然科学基金黑龙江省留学归国人员基金教育部跨世纪优秀人才培养计划更多>>
- 相关领域:电子电信自动化与计算机技术更多>>
- 基于特征似然度加权和维数缩减的Robust语音端点检测被引量:7
- 2007年
- 传统的语音端点检测方法在低信噪比环境下可靠性会急剧下降。本文提出了两种特征处理方法:特征的似然度加权和基于散度的维数缩减,来提高噪声下端点检测的性能。通过加权增加动态特征在似然度计算中的比重,可以提高端点检测的噪声Robustness。缩减散度值较小的特征维,对检测精度只有很小的影响,但可以提高检测效率。似然度加权对维数缩减之后的特征同样有效。在Aurora2数据库上的实验结果显示,在干净数据训练的检测模型下,似然度加权可以显著提高噪声下的端点检测性能。对维数缩减后的特征进行似然度加权,获得了与原始特征似然度加权相当的检测性能。这说明本文提出的方法是有效的。
- 王欢良韩纪庆李海峰
- 关键词:语音端点检测加权和似然度维数
- 基于K-L散度的最大后验弧主导的混淆网络生成算法被引量:5
- 2008年
- 为快速生成高质量混淆网络,该文提出一种最大后验弧主导的快速生成算法。它只需遍历一遍Lattice,具有线性时间复杂度。采用K-L散度(Kullback-Leibler Divergence,KLD)来度量弧标号之间的发音相似性,改善了混淆网络生成中弧对齐的准确性。实验结果显示,所提算法在生成速度上和Xue的快速算法是可比的,而生成质量更好。通过采用KLD作为弧标号相似性测度,生成混淆网络的质量得到了进一步提高。
- 王欢良韩纪庆郑铁然李海峰
- 关键词:语音识别混淆网络LATTICE
- 基于HMM/SVM两级结构的汉语易混淆语音识别被引量:4
- 2006年
- 基于 HMM 的汉语语音识别中,易混淆语音的识别率仍然不高.在分析 HMM 固有缺陷的基础上,本文提出一种使用 SVM 在 HMM 系统上进行二次识别来提高易混淆语音识别率的方法.通过引入置信度估计环节,提高系统性能和效率.通过充分利用 Viterbi 解码获得的信息来构造新的分类特征,从而解决标准 SVM 难以处理可变长数据的问题.详细探讨这种两级识别结构中置信度估计、分类特征提取和 SVM 识别器构造等问题.语音识别实验的结果显示,与采用 HMM/SVM 混合结构的模型相比,本文方法在对识别速度影响很小的情况下可以使识别率有明显提高.这表明所提出的具有置信估计环节的 HMM/SVM 两级结构用于易混淆语音识别是可行的.
- 王欢良韩纪庆李海峰郑铁然
- 关键词:语音识别支持向量机