公共文化服务平台

2025年2月8日星期六

|

欢迎来到青海省图书馆•公共文化服务平台

登录 | 注册 | 进入后台

[APP下载]

[APP下载]

扫一扫,既下载

全民阅读
职业技能
专家智库
参考咨询

您的位置： 专家智库 > >

余丽珍: 作品数：3 被引量：17H指数：2; 供职机构：兰州理工大学电气工程与信息工程学院更多>>; 发文基金：甘肃省财政厅资助项目甘肃省自然科学基金更多>>; 相关领域：自动化与计算机技术电子电信更多>>

合作作者

曹洁兰州理工大学计算机与通信学院

作品列表
供职机构
相关作者
所获基金
研究领域

文献类型

2篇期刊文章
1篇学位论文

领域

2篇自动化与计算...
1篇电子电信

主题

3篇说话人识别
2篇强度特征
2篇混合模型
2篇高斯
2篇高斯混合
2篇高斯混合模型
1篇音频
1篇音频特征
1篇智能环境
1篇视频
1篇视频特征
1篇说话人
1篇GMM
1篇MFCC
1篇初始化

机构

3篇兰州理工大学

作者

3篇余丽珍
2篇曹洁

传媒

2篇计算机应用研...

年份

3篇2012

共 3 条记录，以下是 1-3

全选清除导出

排序方式：

改进的说话人聚类初始化和GMM的多说话人识别被引量：6: 2012年; 针对多说话人聚类线性初始化方法精度较差的问题,提出了一种改进的聚类初始化方法。该方法引入BIC对由线性初始化产生的初始类进行检测分割,有效提升了说话人初始类纯度。最后将该方法应用到高斯混合模型(GMM)多说话人识别系统。实验结果表明,所提方法使说话人平均类纯度(ACP)提高了48.51%,系统的错误识别率平均降低12.09%。; 曹洁余丽珍; 关键词：高斯混合模型

智能环境下基于音频和视频特征融合的多说话人识别: 人类大脑能够在复杂环境下利用其自身特有的融合机能帮助人们准确识别周边事物。在信息产业蓬勃发展的今天，说话人识别技术在模式识别领域不断被提及，因其在某些条件下能够很好地模仿人类机能，甚至赶超人类。而智能会议环境中的说话人识...; 余丽珍; 关键词：音频特征视频特征高斯混合模型

基于MFCC和运动强度聚类初始化的多说话人识别被引量：10: 2012年; 针对常用基于音频特征的多说话人聚类初始化方法精度不高这一问题,提出了一种基于视频信号的新方法。该方法通过运用每一时间帧视频信号的运动强度特征对聚类初始化阶段的初始话者类进行选择,有效提升了说话人初始类纯度。最后将该方法应用到高斯混合模型(GMM)多说话人识别系统。实验结果表明,在整个会议集上该方法相比其他方法有了很大改善,较之线性初始化系统的错误识别率平均降低了19.436%,较之改进的线性初始化系统的错误识别率平均降低了16.618%。; 曹洁余丽珍

全选清除导出

共1页<1>

执行隐藏清空

用户登录

用户反馈

标题：

*标题长度不超过50

邮箱：

*

反馈意见：

反馈意见字数长度不超过255

验证码：

看不清楚？点击换一张