公共文化服务平台

2024年7月10日星期三

|

欢迎来到青海省图书馆•公共文化服务平台

登录 | 注册 | 进入后台

[APP下载]

[APP下载]

扫一扫,既下载

全民阅读
职业技能
专家智库
参考咨询

您的位置： 专家智库 > >

樊博: 作品数：4 被引量：4H指数：1; 供职机构：西北工业大学计算机学院更多>>; 发文基金：国家自然科学基金陕西省自然科学基金霍英东基金更多>>; 相关领域：自动化与计算机技术电子电信更多>>

合作作者

谢磊西北工业大学计算机学院陕西省语...
朱鹏程西北工业大学计算机学院陕西省语...
李冰锋西北工业大学计算机学院陕西省语...
王丽娟微软公司
宋謌平微软公司

作品列表
供职机构
相关作者
所获基金
研究领域

文献类型

2篇期刊文章
2篇会议论文

领域

2篇电子电信
2篇自动化与计算...

主题

4篇语音
4篇语音驱动
1篇动画
1篇动画合成
1篇短时记忆
1篇隐MARKO...
1篇神经网
1篇神经网络
1篇主动外观模型
1篇记忆
1篇RNN
1篇AAM

机构

4篇西北工业大学
1篇微软公司

作者

4篇谢磊
4篇樊博
3篇李冰锋
3篇朱鹏程
1篇宋謌平
1篇王丽娟

传媒

2篇清华大学学报...

年份

1篇2017
3篇2013

共 4 条记录，以下是 1-4

全选清除导出

排序方式：

语音驱动虚拟说话人的自然头动生成: 本文研究了从语音信号预测伴随头动的方法。基于HMM的头动合成方法的效果有赖于头动模式的划分和头动模式的正确识别。为此,本文尝试了不同头动模式划分方法的头动合成效果。由于语音和头动之间是非确定性的多对多的映射关系,很难用固...; 李冰锋谢磊朱鹏程樊博

基于BLSTM-RNN的语音驱动逼真面部动画合成被引量：4: 2017年; 双向长短时记忆(bidirectional lorg short term memory,BLSTM)是一种特殊的递归神经网络(recurrent neural network,RNN),能够有效地对语音的长时上下文进行建模。该文提出一种基于深度BLSTM的语音驱动面部动画合成方法,利用说话人的音视频双模态信息训练BLSTM-RNN神经网络,采用主动外观模型(active appearance model,AAM)对人脸图像进行建模,将AAM模型参数作为网络输出,研究网络结构和不同语音特征输入对动画合成效果的影响。基于LIPS2008标准评测库的实验结果表明:具有BLSTM层的网络效果明显优于前向网络的,基于BLSTM-前向-BLSTM 256节点(BFB256)的三层模型结构的效果最佳,FBank、基频和能量组合可以进一步提升动画合成效果。; 阳珊樊博谢磊王丽娟宋謌平

语音驱动虚拟说话人的自然头动生成: 2013年; 从语音信号预测伴随头动时,基于隐Markov模型(hidden Markov model,HMM)的头动合成方法的效果依赖于头动模式的划分和头动模式的正确识别。该文尝试了不同头动模式划分方法的头动合成效果。由于语音和头动之间是非确定性的多对多的映射关系,很难用固定的类别描述清楚,因此该类方法的头动模式识别率不高,头动合成效果受限。该文尝试采用逆传播(back-propagation,BP)神经网络的非线性回归方法,通过学习语音与头动之间的映射关系,实现语音信号到头动参数之间的直接连续映射,避免了HMM方法中头动模式不明确、头动模式识别错误带来的负面影响。实验表明,基于BP神经网络的回归方法有效地提高了语音到头动预测的准确度和头动合成的自然度。; 李冰锋谢磊朱鹏程樊博; 关键词：隐MARKOV模型神经网络

语音驱动虚拟说话人的自然头动生成: 本文研究了从语音信号预测伴随头动的方法。基于HMM的头动合成方法的效果有赖于头动模式的划分和头动模式的正确识别。为此,本文尝试了不同头动模式划分方法的头动合成效果。由于语音和头动之间是非确定性的多对多的映射关系,很难用固...; 李冰锋谢磊朱鹏程樊博; 文献传递

全选清除导出

共1页<1>

执行隐藏清空

用户登录

用户反馈

标题：

*标题长度不超过50

邮箱：

*

反馈意见：

反馈意见字数长度不超过255

验证码：

看不清楚？点击换一张