2025年2月9日
星期日
|
欢迎来到青海省图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
杨卫星
作品数:
1
被引量:0
H指数:0
供职机构:
武汉大学计算机学院
更多>>
发文基金:
国家自然科学基金
更多>>
相关领域:
自动化与计算机技术
更多>>
合作作者
冯骋
武汉大学计算机学院
梁超
武汉大学计算机学院
谭小琼
武汉大学计算机学院
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
1篇
中文期刊文章
领域
1篇
自动化与计算...
主题
1篇
影视
1篇
影视剧
1篇
说话人聚类
1篇
说话人识别
1篇
模态
1篇
聚类
1篇
混合高斯
1篇
混合高斯模型
1篇
高斯
1篇
高斯模型
机构
1篇
武汉大学
作者
1篇
谭小琼
1篇
梁超
1篇
冯骋
1篇
杨卫星
传媒
1篇
计算机应用与...
年份
1篇
2016
共
1
条 记 录,以下是 1-1
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
基于跨模态的无监督影视剧说话人识别
2016年
现如今,影视剧的海量增长给其有效管理带来了巨大挑战,而其中的角色识别在影视剧内容管理中具有重大意义。传统的角色识别主要采用依赖于训练样本质量的有监督学习,而现实中一般难以获得充足的训练样本。针对影视剧中的角色识别,提出一种跨模态的无监督说话人识别方法:首先基于声学特征和时间近邻性的音频聚类获得对应聚类结果的音频标记序列;然后通过剧本解析获得对应说话人、说话内容、说话时间的文本标记序列;接着将音频序列与文本序列进行跨模态序列匹配,构造满射解出最小编辑距离,从而实现说话人识别。实验结果表明,在训练集较少的情况下该方法比有监督方法具有更高识别率。
冯骋
库天锡
杨卫星
李雪蒙
谭小琼
梁超
关键词:
说话人识别
说话人聚类
混合高斯模型
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张