您的位置: 专家智库 > >

宋謌平

作品数:1 被引量:4H指数:1
供职机构:微软公司更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇动画
  • 1篇动画合成
  • 1篇短时记忆
  • 1篇语音
  • 1篇语音驱动
  • 1篇主动外观模型
  • 1篇记忆
  • 1篇RNN
  • 1篇AAM

机构

  • 1篇西北工业大学
  • 1篇微软公司

作者

  • 1篇谢磊
  • 1篇宋謌平
  • 1篇樊博
  • 1篇王丽娟

传媒

  • 1篇清华大学学报...

年份

  • 1篇2017
1 条 记 录,以下是 1-1
排序方式:
基于BLSTM-RNN的语音驱动逼真面部动画合成被引量:4
2017年
双向长短时记忆(bidirectional lorg short term memory,BLSTM)是一种特殊的递归神经网络(recurrent neural network,RNN),能够有效地对语音的长时上下文进行建模。该文提出一种基于深度BLSTM的语音驱动面部动画合成方法,利用说话人的音视频双模态信息训练BLSTM-RNN神经网络,采用主动外观模型(active appearance model,AAM)对人脸图像进行建模,将AAM模型参数作为网络输出,研究网络结构和不同语音特征输入对动画合成效果的影响。基于LIPS2008标准评测库的实验结果表明:具有BLSTM层的网络效果明显优于前向网络的,基于BLSTM-前向-BLSTM 256节点(BFB256)的三层模型结构的效果最佳,FBank、基频和能量组合可以进一步提升动画合成效果。
阳珊樊博谢磊王丽娟宋謌平
共1页<1>
聚类工具0