杨庆涛
- 作品数:4 被引量:8H指数:1
- 供职机构:上海大学机电工程与自动化学院更多>>
- 发文基金:上海市青年科技启明星计划上海市教育发展基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于语音的多媒体场景标记辅助系统
- 标引的目的是通过给音频-视频数据加入标记,对其内容进行描述,以便于信息的检索和查询。语音标引在媒体资产管理中扮演了很重要的角色。本文介绍了一种基于语音识别的多媒体场景标记辅助系统,该系统可自动识别标引员所说的短语,辅助标...
- 杨庆涛
- 关键词:媒体资产管理EBF网络数据融合
- 文献传递
- 实用语音识别的场景标记辅助系统
- 2006年
- 标引是通过给音频-视频数据加入标记,对其内容进行描述,以便于信息的检索和查询。语音标引在媒体资产管理中扮演了很重要的脚色。介绍了一种基于EBF网络的语音标引辅助系统,该系统可自动识别标引员所说的短语,辅助标引员在视频媒体上实现标引。系统从语句中将这些短语分割出来,并通过EBF神经网络进行建模。实验结果证明,该系统具有实用性,在媒体资产管理方面有良好的应用前景。
- 杨庆涛李昕郑宇张芸
- 关键词:媒体资产管理EBF网络
- 一种基于EBF网络的语音标引辅助系统
- 的目的是通过给音频一视频数据加入标记,对其内容进行描述,以便于信息的检索和查询。语音标引在媒体资产管理中扮演了很重要的角色。本文介绍了一种基于EBF网络的语音标引辅助系统,该系统可自动识别标引员所说的短语,辅助标引员在视...
- 杨庆涛李昕张芸郑宇
- 一种基于Fisher准则的说话人识别方法研究被引量:8
- 2007年
- 在说话人识别系统中,提高反映说话人个性的语音信号特征参数的有效性和实时性是关键问题之一.本文在使用线性预测系数倒谱(LPCC)和美尔倒谱系数(MFCC)计算特征参数的基础上利用Fisher准则,构造了一种新的混合特征参数.这种新的参数在不增加系统计算量的同时,结合了LPCC和MFCC各自的优点,具有更好地表征说话人特征的能力,并在一定程度上消除特征的信息冗余,有利于信息的实时处理.
- 张芸李昕郑宇杨庆涛
- 关键词:说话人识别FISHER准则