赵征鹏
- 作品数:61 被引量:136H指数:7
- 供职机构:云南大学信息学院更多>>
- 发文基金:国家自然科学基金云南省教育厅科学研究基金云南省科技厅科研基金更多>>
- 相关领域:自动化与计算机技术电子电信文化科学理学更多>>
- 基于MLLR和MAP非母语说话人自适应语音识别
- 说话人自适应是提高非特定人语音识别系统识别性能的有效手段,本文针对非母语说话人,结合常规的自适应技术MLLR和MAP,探索云南纳西族和傈僳族两种母语说话人的汉语普通话语音识别问题,实验结果显示有显著效果。
- 尉洪杨鉴普园媛赵征鹏
- 关键词:说话人自适应MAP
- 文献传递
- 一种基于多模态数据的图像情感识别方法及系统
- 本发明涉及一种基于多模态数据的图像情感识别方法及系统,包括:获取训练样本数据;根据训练样本数据得训练好的循环神经网络以及训练好的卷积神经网络;获取待识别数据;将待识别文本数据输入训练好的循环神经网络,得文本特征;将待识别...
- 普园媛阿曼徐丹赵征鹏钱文华袁国武杨文武陈云龙
- 文献传递
- 基于双流循环映射网络的肖像漫画化
- 2023年
- 肖像风格迁移旨在将参考艺术肖像画中迁移到人物照片上,同时保留人物面部的基本语义结构。然而,由于人类视觉对肖像面部语义结构的敏感性,使得肖像风格迁移任务比一般图像的风格迁移更具挑战性,现有的风格迁移方法未考虑漫画风格的抽象性以及肖像面部语义结构的保持,所以应用到肖像漫画化任务时会出现严重的结构坍塌及特征信息混乱等问题。为此,提出了一个双流循环映射网DSCM。首先,引入了一个结构一致性损失来保持肖像整体语义结构的完整性;其次,设计了一个结合U~2-Net的特征编码器在不同尺度下帮助网络捕获输入图像更多有用的特征信息;最后,引入了风格鉴别器来对编码后的风格特征进行鉴别,从而辅助网络学习到更接近目标图像的抽象漫画风格特征。实验与五种先进方法进行了定性及定量的比较,该方法均优于其他方法,其不仅能够完整地保持肖像的整体结构和面部的基本语义结构,而且能够充分学习到风格类型。
- 孔凡敏普园媛赵征鹏赵征鹏阳秋霞
- 基于深度学习与传统特征的多尺度服装检索方法及系统
- 本发明涉及一种基于深度学习与传统特征的多尺度服装检索方法及系统,包括提取待检索服装图像和图像数据库中的服装图像的多尺度级联CNN特征;根据待检索服装图像和图像数据库中的服装图像的多尺度级联CNN特征计算第一欧氏距离;使用...
- 普园媛王志伟王鑫徐丹钱文华赵征鹏徐俊袁国武余鹏飞
- 极化自注意力约束颜色溢出的图像自动上色被引量:2
- 2023年
- 自动上色可以将灰度图像转换为色彩合理的自然彩色图像,可以为老旧照片、黑白影视作品等重新恢复颜色,因此在计算机视觉和图形学领域受到广泛关注。然而,为灰度图像分配色彩是一项极具挑战性的任务,存在颜色溢出问题。为解决该问题,提出了一种极化自注意力约束颜色溢出的图像自动上色方法。首先,将前景中的实例和背景分开,降低背景对前景的上色影响,从而减少前景和背景之间的颜色溢出;然后,使用极化自注意力模块把特征分为颜色通道和空间位置两部分,使上色更加准确、具体,从而减少全局图像、实例对象内的颜色溢出;最后,结合融合模块,将全局特征和实例特征通过不同权重融合为一体,完成最终上色。实验结果表明,与ChromaGAN,MemoGAN等算法相比,所提方法在主要指标FID,LPIPS上分别提升了9.7%和10.9%,且SSIM和PSNR指标均达到最优。
- 刘航普园媛吕大华赵征鹏赵征鹏徐丹
- 关键词:目标检测
- 色彩传递的方法和装置
- 本发明公开了一种色彩传递的方法和装置。其中,该方法基于Lαβ颜色空间进行,包括:根据色彩传递任务在原图和目标图中选择一对或多对对应区域;针对每对对应区域为原图中的每个像素点设置CTWC,其中,像素点的CTWC与像素点到原...
- 普园媛徐丹苏迤魏小敏赵征鹏王朝晖
- 文献传递
- 基于人-物关键点时空交互的扶梯乘客危险行为识别方法
- 本发明提供了一种基于人‑物关键点时空交互的扶梯乘客危险行为识别方法,属于危险行为检测领域,方法包括:基于姿态估计算法从待识别视频中提取人体骨架特征,得到骨架序列(包括待识别视频每帧图像中的人体关节点位置及各人体关节点的置...
- 谷金晶邓鑫普园媛赵征鹏
- 基于高斯混合模型的非母语说话人口音识别被引量:5
- 2005年
- 针对云南境内白族、纳西族、傈僳族 3 个典型的少数民族及汉族普通话语音,采用了高斯混合模型来训练每个民族的口音模型,并用少量的测试语音来获得较为满意的口音分类识别率,目的在于探索降低非母语口音话者语音识别错误率的有效途径。该文通过实验给出,对云南民族口音汉语普通话口音识别,当混合数为 16,语音特征采用 39 维 MFCC 及其一阶、二阶差分参数时,口音识别正确率可达90.83%。
- 赵征鹏杨鉴
- 基于多特征融合的多尺度服装图像精准化检索被引量:13
- 2020年
- 为了充分挖掘服装图像从全局到局部的多级尺度特征,同时发挥深度学习与传统特征各自在提取服装图像深层语义特征和底层特征上的优势,从而实现聚焦服装本身与服装全面特征的提取,提出基于多特征融合的多尺度服装图像精准化检索算法.首先,为了不同类型特征的有效融合,本文设计了基于特征相似性的融合公式FSF(Feature Similarity Fusion).其次,基于YOLOv3模型同时提取服装全局、主体和款式部件区域构成三级尺度图像,极大减弱背景等干扰因素的影响,聚焦服装本身.之后全局、主体和款式部件三级尺度图像分别送入三路卷积神经网络(Convolutional Neural Network,CNN)进行特征提取,每路CNN均依次进行过服装款式属性分类训练和度量学习训练,分别提高了CNN对服装款式属性特征的提取能力,以及对不同服装图像特征的辨识能力.提取的三路CNN特征使用FSF公式进行特征融合,得到的多尺度CNN融合特征则包含了服装图像从全局到主体,再到款式部件的全面特征.然后,加入款式属性预测优化特征间欧氏距离,同时抑制语义漂移,得到初步检索结果.最后,由于底层特征可以很好的对CNN提取的深层语义特征进行补充,故引入传统特征对初步检索结果的纹理、颜色等特征进行约束,通过FSF公式将多尺度CNN融合特征与传统特征相结合,进一步优化初步检索结果的排序.实验结果表明,该算法可以实现对服装从全局到款式部件区域多尺度CNN特征的充分提取,同时结合传统特征有效优化排序结果,提升检索准确率.在返回Top-20的实验中,相比于FashionNet模型准确率提升了16.4%."
- 王志伟普园媛王鑫王鑫赵征鹏徐丹
- 关键词:多尺度
- 改进的Retinex低照度图像清晰化处理被引量:6
- 2021年
- 为了减小低照度图像在图像预处理过程中所造成的影响,提出一种HSV空间的基于巴特沃斯低通滤波(BLPF)的改进Retinex算法。把低照度图像从RGB各通道转换到HSV各通道,对饱和度分量进行自适应线性拉伸,对亮度分量进行基于BLPF的改进Retinex增强,不仅有效地降低噪声的干扰,在增强图像暗区亮度的同时抑制局部高亮区的"光晕",而且凸显图像细节,还原图像原有的色彩。通过大量测试,验证了该方法的有效性。
- 赵征鹏李俊钢普园媛
- 关键词:RETINEX理论低照度图像图像增强