您的位置: 专家智库 > >

樊博

作品数:4 被引量:4H指数:1
供职机构:西北工业大学计算机学院更多>>
发文基金:国家自然科学基金陕西省自然科学基金霍英东基金更多>>
相关领域:自动化与计算机技术电子电信更多>>

文献类型

  • 2篇期刊文章
  • 2篇会议论文

领域

  • 2篇电子电信
  • 2篇自动化与计算...

主题

  • 4篇语音
  • 4篇语音驱动
  • 1篇动画
  • 1篇动画合成
  • 1篇短时记忆
  • 1篇隐MARKO...
  • 1篇神经网
  • 1篇神经网络
  • 1篇主动外观模型
  • 1篇记忆
  • 1篇RNN
  • 1篇AAM

机构

  • 4篇西北工业大学
  • 1篇微软公司

作者

  • 4篇谢磊
  • 4篇樊博
  • 3篇李冰锋
  • 3篇朱鹏程
  • 1篇宋謌平
  • 1篇王丽娟

传媒

  • 2篇清华大学学报...

年份

  • 1篇2017
  • 3篇2013
4 条 记 录,以下是 1-4
排序方式:
语音驱动虚拟说话人的自然头动生成
本文研究了从语音信号预测伴随头动的方法。基于HMM的头动合成方法的效果有赖于头动模式的划分和头动模式的正确识别。为此,本文尝试了不同头动模式划分方法的头动合成效果。由于语音和头动之间是非确定性的多对多的映射关系,很难用固...
李冰锋谢磊朱鹏程樊博
基于BLSTM-RNN的语音驱动逼真面部动画合成被引量:4
2017年
双向长短时记忆(bidirectional lorg short term memory,BLSTM)是一种特殊的递归神经网络(recurrent neural network,RNN),能够有效地对语音的长时上下文进行建模。该文提出一种基于深度BLSTM的语音驱动面部动画合成方法,利用说话人的音视频双模态信息训练BLSTM-RNN神经网络,采用主动外观模型(active appearance model,AAM)对人脸图像进行建模,将AAM模型参数作为网络输出,研究网络结构和不同语音特征输入对动画合成效果的影响。基于LIPS2008标准评测库的实验结果表明:具有BLSTM层的网络效果明显优于前向网络的,基于BLSTM-前向-BLSTM 256节点(BFB256)的三层模型结构的效果最佳,FBank、基频和能量组合可以进一步提升动画合成效果。
阳珊樊博谢磊王丽娟宋謌平
语音驱动虚拟说话人的自然头动生成
2013年
从语音信号预测伴随头动时,基于隐Markov模型(hidden Markov model,HMM)的头动合成方法的效果依赖于头动模式的划分和头动模式的正确识别。该文尝试了不同头动模式划分方法的头动合成效果。由于语音和头动之间是非确定性的多对多的映射关系,很难用固定的类别描述清楚,因此该类方法的头动模式识别率不高,头动合成效果受限。该文尝试采用逆传播(back-propagation,BP)神经网络的非线性回归方法,通过学习语音与头动之间的映射关系,实现语音信号到头动参数之间的直接连续映射,避免了HMM方法中头动模式不明确、头动模式识别错误带来的负面影响。实验表明,基于BP神经网络的回归方法有效地提高了语音到头动预测的准确度和头动合成的自然度。
李冰锋谢磊朱鹏程樊博
关键词:隐MARKOV模型神经网络
语音驱动虚拟说话人的自然头动生成
本文研究了从语音信号预测伴随头动的方法。基于HMM的头动合成方法的效果有赖于头动模式的划分和头动模式的正确识别。为此,本文尝试了不同头动模式划分方法的头动合成效果。由于语音和头动之间是非确定性的多对多的映射关系,很难用固...
李冰锋谢磊朱鹏程樊博
文献传递
共1页<1>
聚类工具0