汪志鸿
- 作品数:5 被引量:10H指数:2
- 供职机构:中国科学院声学研究所更多>>
- 发文基金:国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 语音浏览器的概念、框架和应用
- 2007年
- 分析了语音浏览器的概念和框架,以及语音输入、对话管理和响应生成整个口语对话过程的标记规范,重点说明了语音浏览器的核心标准VoiceXML的原理和工作特性,并描述了应用语音浏览器创建口语对话系统的整体方案。以此为基础,本文给出了语音浏览器在股票交易系统中的具体应用实例。通过语音浏览器平台,可以创建灵活性很强的混合主导对话模式的口语对话系统。
- 汪志鸿张海云陈柯杜利民
- 关键词:语音浏览器VOICEXML口语对话系统
- 基于XML的知识表示体系和汉语口语对话系统通用模型研究
- 口语对话系统是当前人机交互领域的一个重要的研究课题。该文研究如何建立对话系统中统一的知识表示模型和如何建立通用的口语对话系统的方法,使口语对话系统的开发更加规范化、工程化和实用化。论文的主要贡献如下:
(1)建...
- 汪志鸿
- 关键词:口语对话系统知识表示XML语音识别自然语言理解
- 使用期待提高对话系统的语音识别率被引量:3
- 2006年
- 在回顾了各种语言模型的基础上,针对如何更有效地构建口语对话系统中语音识别器的语言模型展开讨论,研究并实现了使用系统期待来建立语言模型的方法.在口语对话系统中,根据系统提出的问题或者系统给用户的提示,对话管理器产生对用户响应的期待,也称作系统期待.由于系统期待是建立在对话系统当前状态的基础上,所以可根据系统当前状态构建系统期待,从而建立更加优化的语言模型,并使用此语言模型来提高语音识别的识别率.
- 汪志鸿于水源杜利民
- 关键词:语音识别语言模型
- 基于三角剖分的人脸纹理映射被引量:7
- 2007年
- 采用通用的三维人脸模型和任意的人脸纹理图像,基于Delaunay三角剖分,提出了一种灵活的3D人脸的纹理映射方法。该方法对人脸特征点集做三角剖分,在纹理图像和三维网格之间建立了一个准确的拓扑同构映射关系,从而得到高真实度的纹理映射。该算法不受网格调整精度的影响,同时适用于不同的纹理映射到同一三维人脸模型上。
- 陈柯杜利民赵向阳汪志鸿
- 关键词:人脸重建纹理映射DELAUNAY三角剖分
- 基于清浊音状态空间模型语音增强算法
- 2006年
- 基于语音状态模型的语音增强算法是当前语音信号处理的研究热点。把通常的LPC语音模型修正后,将得到两个语音模型:时变AR模型、时变双AR模型。但是利用这些模型增强语音时,都没有考虑到语音的清音、浊音区别。为此本文引入了语音清浊音状态空间模型,这种模型在描述语音方面比时变AR模型、时变双AR模型要强,而且物理含义明显。同时在用含噪语音信号预测纯净语音信号时,引入遗忘因子和粒子滤波算法以降低计算复杂性,减小运算量。实验证明,增强后的语音信号信噪比有一定提高,且优于传统的LPC模型。
- 张海云汪志鸿杜利民
- 关键词:语音增强遗忘因子粒子滤波