梁超
- 作品数:11 被引量:188H指数:3
- 供职机构:武汉大学计算机学院更多>>
- 发文基金:国家自然科学基金湖北省自然科学基金国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术文化科学电子电信更多>>
- 基于跨模态的无监督影视剧说话人识别
- 2016年
- 现如今,影视剧的海量增长给其有效管理带来了巨大挑战,而其中的角色识别在影视剧内容管理中具有重大意义。传统的角色识别主要采用依赖于训练样本质量的有监督学习,而现实中一般难以获得充足的训练样本。针对影视剧中的角色识别,提出一种跨模态的无监督说话人识别方法:首先基于声学特征和时间近邻性的音频聚类获得对应聚类结果的音频标记序列;然后通过剧本解析获得对应说话人、说话内容、说话时间的文本标记序列;接着将音频序列与文本序列进行跨模态序列匹配,构造满射解出最小编辑距离,从而实现说话人识别。实验结果表明,在训练集较少的情况下该方法比有监督方法具有更高识别率。
- 冯骋库天锡杨卫星李雪蒙谭小琼梁超
- 关键词:说话人识别说话人聚类混合高斯模型
- 面向科研团队的网站建设与管理
- 2015年
- 随着信息技术的普及,网站已经成为高校科研团队最为重要的宣传平台与沟通渠道。相比于学者个人网站,科研团队网站更加关注以团队为主体的科研与教学活动,具有覆盖面广、时效性强和可信度高等特点,因此个人网站的建设经验并不能完全满足科研团队网站的建设与管理需要。本文以笔者所在科研团队的建站实践为基础,重点讨论科研团队网站不同于个人网站的主要特点,以及由此所带来的团队网站在运维和管理上的独特需求和解决办法。
- 梁超阮威健姚磊黄冰月
- 关键词:科研团队运维
- 人工智能专业研究生培养方案修订:问题、原因与对策被引量:2
- 2022年
- 针对人工智能专业研究生培养方案修订过程中暴露出来的人才培养目标不明确、课程同质化现象严重和学生实践能力薄弱等问题,从学科定位、课程设置和产学合作等方面进行原因分析,据此提出按照一级学科制订研究生培养方案,建立本硕博贯通的研究生培养体系和依托产学合作平台开展校企协同育人的对策。
- 梁超李兵彭敏汤洁
- 关键词:研究生教育
- 基于视觉显著度的说话检测
- 2015年
- 现有基于视觉信息的说话检测方法中往往依赖预定参数或者阈值作为分类平面,鲁棒性差且泛化能力不强.针对这一问题,本文提出了一种基于显著度的视觉说话检测方法,利用像素的色彩信息和嘴唇的空间位置特性检测嘴唇,通过分析嘴唇运动和说话假设的关系,将图像能量作为特征,并结合经典的隐马尔科夫模型(hidden Markov models,HMM)和支持向量机(support vector machine,SVM)作为判决方法来进行检测.实验结果表明,本文提出的嘴唇检测方法正确率可达到92%.
- 王瑾梁超王晓晨王中元胡瑞敏
- 关键词:图像能量隐马尔科夫模型支持向量机
- 融合有判别力仿射局部特征上下文的图像分类被引量:2
- 2014年
- 已有的针对上下文信息的大多数工作均侧重于视觉词之间的上下文信息建模,没有考虑到局部特征之间的上下文信息建模问题,且图像在拍照时往往受到姿势、尺度变化,光照以及相机参数的影响,导致分类精度不高.文中综合考虑局部特征之间的上下文信息,提出一种基于有判别力仿射局部特征上下文的图像分类方法.对于一幅图像上的某一位置,采用该区域的局部特征,及其周边一定距离、角度内的局部特征来进行描述(局部特征上下文);然后对这些局部特征上下文进行仿射变换,并通过最小化编码损失的策略来进行有判别力的仿射局部特征上下文的选择,得到更有判别力的特征.最后通过实验结果验证了该方法的有效性.
- 张淳杰熊威张一帆梁超张维刚黄庆明
- 关键词:仿射不变性图像分类
- 面向计算机专业的量子计算课程教学探索被引量:3
- 2022年
- 结合计算机专业量子计算课程的教学实际,深入分析课程教学的目标和难点,在此基础上从课程结构和内容、教学方式和方法方面给出有针对性的设计,为未来计算机学科的量子计算课程教学实践提供有益的参考和借鉴。
- 梁超王浩冰张寒子逸
- 关键词:计算机专业本科生量子计算教学实践
- 多源数据行人重识别研究综述被引量:23
- 2020年
- 行人重识别是近年来计算机视觉领域的热点问题,经过多年的发展,基于可见光图像的一般行人重识别技术已经趋近成熟.然而,目前的研究多基于一个相对理想的假设,即行人图像都是在光照充足的条件下拍摄的高分辨率图像.因此虽然大多数的研究都能取得较为满意的效果,但在实际环境中并不适用.多源数据行人重识别即利用多种行人信息进行行人匹配的问题.除了需要解决一般行人重识别所面临的问题外,多源数据行人重识别技术还需要解决不同类型行人信息与一般行人图片相互匹配时的差异问题,如低分辨率图像、红外图像、深度图像、文本信息和素描图像等.因此,与一般行人重识别方法相比,多源数据行人重识别研究更具实用性,同时也更具有挑战性.本文首先介绍了一般行人重识别的发展现状和所面临的问题,然后比较了多源数据行人重识别与一般行人重识别的区别,并根据不同数据类型总结了5类多源数据行人重识别问题,分别从方法、数据集两个方面对现有工作做了归纳和分析.与一般行人重识别技术相比,多源数据行人重识别的优点是可以充分利用各类数据学习跨模态和类型的特征转换.最后,本文讨论了多源数据行人重识别未来的发展.
- 叶钰王正梁超韩镇韩镇胡瑞敏
- 图像分割方法综述被引量:152
- 2020年
- 为了解图像分割领域的研究现状,对图像分割方法进行了系统性梳理,首先按照基于阈值、边缘、区域、聚类、图论及特定理论等6类方法介绍传统图像分割方法;然后介绍基于深度学习的分割方法,并探讨了几种常用的分割网络模型,包括全卷积网络(full convolutional network,FCN)、金字塔场景解析网络(pyramid scene parsing network,PSPNet)、DeepLab、Mask R-CNN;最后在图像分割的常用数据集上对同类方法进行了性能比较和分析。
- 黄鹏郑淇梁超
- 关键词:图像处理图像分割
- 武汉大学人工智能专业建设构想被引量:3
- 2019年
- 随着计算机技术的不断进步,人工智能产业得到了飞速发展。在人工智能的浪潮下,世界各国纷纷出台相关的发展战略,以推动国家产业变革。中国政府对人工智能产业发展高度重视,统筹部署相应的战略规划,将人工智能提升到促进经济发展、保障国土安全的新高度。武汉大学积极响应国家创新驱动的发展战略,向建设成为世界一流综合性大学的目标迈进,整合学科资源优势,设置人工智能本科专业,旨在培养适应人工智能发展的创新型人才。
- 梁超黄鹏郑淇肖晶
- 关键词:人工智能
- 联合特定人物和场景的视频实例检索问题与方法
- 2018年
- 以广播电视视频为研究对象,重点研究了联合特定人物和场景的视频实例检索技术,旨在从海量视频中查找特定人物出现在特定场景中的视频片段。文中提出了实现联合特定人物和场景的视频实例检索的通用技术框架,包括视频中特定人物检索、特定场景检索和检索结果排序优化。特别是针对技术框架中特定场景的准确检索问题,提出了基于局部与全局特征组合优化的特定场景检索方法;针对检索结果排序优化的问题,研究了基于噪声去除和近邻补全的结果优化方法。使用本文所提方法参加国际视频检索性能评测Trecvid 2016实例检索任务所取得的结果。实验结果验证了所提框架及其实现方法的合理性、有效性和先进性。
- 杨洋兰佳梅关硕森姚磊梁超
- 关键词:视频检索组合优化噪声去除