您的位置: 专家智库 > >

余丽珍

作品数:3 被引量:16H指数:2
供职机构:兰州理工大学电气工程与信息工程学院更多>>
发文基金:甘肃省财政厅资助项目甘肃省自然科学基金更多>>
相关领域:自动化与计算机技术电子电信更多>>

文献类型

  • 2篇期刊文章
  • 1篇学位论文

领域

  • 2篇自动化与计算...
  • 1篇电子电信

主题

  • 3篇说话人识别
  • 2篇强度特征
  • 2篇混合模型
  • 2篇高斯
  • 2篇高斯混合
  • 2篇高斯混合模型
  • 1篇音频
  • 1篇音频特征
  • 1篇智能环境
  • 1篇视频
  • 1篇视频特征
  • 1篇说话人
  • 1篇GMM
  • 1篇MFCC
  • 1篇初始化

机构

  • 3篇兰州理工大学

作者

  • 3篇余丽珍
  • 2篇曹洁

传媒

  • 2篇计算机应用研...

年份

  • 3篇2012
3 条 记 录,以下是 1-3
排序方式:
改进的说话人聚类初始化和GMM的多说话人识别被引量:5
2012年
针对多说话人聚类线性初始化方法精度较差的问题,提出了一种改进的聚类初始化方法。该方法引入BIC对由线性初始化产生的初始类进行检测分割,有效提升了说话人初始类纯度。最后将该方法应用到高斯混合模型(GMM)多说话人识别系统。实验结果表明,所提方法使说话人平均类纯度(ACP)提高了48.51%,系统的错误识别率平均降低12.09%。
曹洁余丽珍
关键词:高斯混合模型
智能环境下基于音频和视频特征融合的多说话人识别
人类大脑能够在复杂环境下利用其自身特有的融合机能帮助人们准确识别周边事物。在信息产业蓬勃发展的今天,说话人识别技术在模式识别领域不断被提及,因其在某些条件下能够很好地模仿人类机能,甚至赶超人类。而智能会议环境中的说话人识...
余丽珍
关键词:音频特征视频特征高斯混合模型
基于MFCC和运动强度聚类初始化的多说话人识别被引量:10
2012年
针对常用基于音频特征的多说话人聚类初始化方法精度不高这一问题,提出了一种基于视频信号的新方法。该方法通过运用每一时间帧视频信号的运动强度特征对聚类初始化阶段的初始话者类进行选择,有效提升了说话人初始类纯度。最后将该方法应用到高斯混合模型(GMM)多说话人识别系统。实验结果表明,在整个会议集上该方法相比其他方法有了很大改善,较之线性初始化系统的错误识别率平均降低了19.436%,较之改进的线性初始化系统的错误识别率平均降低了16.618%。
曹洁余丽珍
共1页<1>
聚类工具0