郭武
- 作品数:90 被引量:213H指数:9
- 供职机构:中国科学技术大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划安徽省自然科学基金更多>>
- 相关领域:电子电信自动化与计算机技术语言文字更多>>
- 基于句子级BLEU指标挑选数据的半监督神经机器翻译被引量:5
- 2017年
- 在单语语料的使用上,统计机器翻译可通过利用语言模型提高性能,而神经机器翻译很难通过这种方法有效利用单语语料.针对此问题,文中提出基于句子级双语评估替补(BLEU)指标挑选数据的半监督神经网络翻译模型.分别利用统计机器翻译和神经机器翻译模型对无标注数据生成候选翻译,然后通过句子级BLEU指标挑选单语候选翻译,加入到有标注的数据集中进行半监督联合训练.实验表明,文中方法能高效利用无标注的单语语料,在NIST汉英翻译任务上,相比仅使用精标的有标注数据单系统,文中方法 BLEU值有所提升.
- 叶绍林郭武
- 采用无监督聚类得分规整的说话人确认方法
- 本发明公开了一种采用无监督聚类得分规整的说话人确认方法,包括:对于注册集当前说话人模型,与包含L条语料的规整数据集进行测试,得到L个测试得分;利用K均值算法对L个测试得分进行聚类,筛选出均值靠前的若干类得分;采用期望最大...
- 郭武古斌
- 文献传递
- 采用高级特征融合的端到端多通道语音识别方法
- 本发明公开了一种采用高级特征融合的端到端多通道语音识别方法,包括:对于多通道语音输入,采用与通道数目相同的编码器单独对一个通道的语音输入进行编码;所述编码器为多层金字塔结构的神经网络,神经网络最后一层输出的声学特征序列称...
- 郭武刘谭
- 基于语言学知识的发音质量评价算法改进被引量:15
- 2007年
- 随着普通话推广工作的深入,采用计算机进行普通话的辅助测试和学习的需求日益迫切。本文针对普通话发音特点,提出了一种改进的基于音素的自动发音质量评价算法。新算法在隐马尔科夫模型的对数后验概率算法基础上,引入普通话发音的语言学知识。与改进前相比,新算法不仅降低了运算量,而且在普通话水平测试的303人现场录音库上,使得机器打分与国家级评测员打分之间的相关度从0.704提升到0.795。
- 刘庆升魏思胡郁郭武王仁华
- 关键词:计算机应用中文信息处理语音识别语言学知识
- 采用模型间距离夹角的说话人确认测试算法
- 2008年
- 提出在与文本无关说话人确认中采用模型间马氏(Mahalanobis)距离的夹角作为测试算法,在混合高斯模型(Gaussian Mixture Model)的情况下,采用这种算法在保持识别率与传统的对数似然度算法相近的前提下,可以大大降低运算量,对于说话人确认或识别的实时实现有很大的帮助.另外,推荐的算法与传统的对数似然度算法的结果可以融合,可以将说话人确认的等错误率降低12~15%.
- 郭武王仁华戴礼荣
- 关键词:说话人确认
- 采用双向时序卷积与自注意力机制网络的语音识别系统
- 本发明公开了一种采用双向时序卷积与自注意力机制网络的语音识别系统,一方面,采用双向时序卷积与自注意力机制网络既保证语音时序的感知又提升:通过双向时序卷积(Bidirectional Temporal Convolutio...
- 郭武孙健
- 文献传递
- 语音文档分类方法、系统、设备及存储介质
- 本发明公开了一种语音文档分类方法、系统、设备及存储介质,通过融合声学特征和深度特征实现语音文档分类,采用训练好的用于语音识别的声学模型为每个语音文档提取包含语义信息的深度特征,然后将语音文档的底层的声学特征和提取的深度特...
- 郭武刘谭
- 文献传递
- 基于模型距离和支持向量机的说话人确认被引量:2
- 2009年
- 针对采用支持向量机的说话人的确认问题,提出采用背景模型、说话人模型、测试语句模型间距离和夹角作为支持向量机的特征矢量,同时将组特征矢量与广义线性判别式序列核函数的参数相拼接,能够取得相对于基线的混合高斯模型算法更高的识别率。在2004年NIST评测数据库上,采用推荐算法的系统等错误率比基线的混合高斯-背景模型系统低16%。对说话人识别取得一定进展。
- 姚红梁栋郭武
- 基于均值超矢量聚类和特征映射的说话人确认被引量:1
- 2009年
- 在与文本无关的说话人确认研究中,特征映射是减少信道影响的最有效的方法之一。但是随着信道的复杂化,特征映射的效果很难体现出来。本文在混合高斯模型的均值超矢量上采用EM算法对信道类型进行聚类,然后通过特征映射的方法在特征参数域中减去信道的影响。在NIST SRE 2006数据库1conv4w-1conv4w任务上,采用本文方法的系统相对基线系统在等错误率上降低了18%。
- 郭武戴礼荣王仁华
- 关键词:说话人确认特征映射
- 一种有效的视频信号编码块效应消减技术被引量:2
- 1998年
- 针对视频信号编码中存在的块效应,提出了一个能有效提高解码图象质量的编码方案。首先,给出一种按系数自适应DCT编码算法的新的逻辑实现结构;然后,用一种简单而有效的自适应控制策略来代替极其复杂费时的严格的自适应方法。同时,为了克服低比特率下粗糙量化导致自适应性能下降的缺点,设计了一种具有良好性能的运动估计快速算法用来提高适应能力。实验结果表明,与常规的基于DCT的编码方法相比,这种编码方案性能有显著的提高。
- 何润中王仁华郭武
- 关键词:块效应