方玉明 作品数:17 被引量:64 H指数:5 供职机构: 江西财经大学信息管理学院 更多>> 发文基金: 国家自然科学基金 江西省自然科学基金 江西省主要学科学术和技术带头人培养计划 更多>> 相关领域: 自动化与计算机技术 文化科学 理学 更多>>
高校“人工智能基础”课程教学改革——基于BOPPPS教学模式与项目驱动教学法 被引量:7 2023年 针对非理工类院校中管理类与信息类学科的“人工智能基础”课程教学,分析此类院校课程设计与教学实施中存在的教学目标与教材单一性、教学内容科普性且缺乏前沿性、实践环节不足等问题,提出基于BOPPPS教学模式、引入项目驱动教学法的“人工智能基础”课程教学,说明实施策略与教学实践过程,探讨应用效果与潜在问题,旨在充分发挥目标导向与以学生为中心的新模式带来对学生的推动作用,更新学生对教学活动的认知和驱使学生形成新的学习观。 夏雪 姜文晖 左一帆 方玉明关键词:教学改革 联合序列和空间注意力机制的光场显著性检测算法 2023年 光场图像包含丰富的空间视差信息和精确的深度信息,利用光场图像的丰富视觉信息实现准确的显著目标检测是重要的研究课题.然而,由于光场图像包含焦堆栈图像序列、全聚焦图像等多幅不同特性的图像数据,面向二维图像的特征提取方法不能有效地融合光场图像中不同序列不同空间的互补信息.针对这一问题,本文提出一种联合序列和空间注意力机制的光场显著性检测模型.针对焦堆栈图像序列,利用RFB模块和特征金字塔结构提取全局信息丰富且细节信息充分的语义特征.同时,提出一种联合序列和空间的自注意力机制,利用多头自注意力操作对焦堆栈图像特征从序列和空间维度联合建模,从而实现对焦堆栈图像序列特征的增强与融合.该机制能够同时建模图像的长距离、空间相关性和特征的内部关联性,从而在不同空间位置反映不同焦堆栈图像的重要性,有利于检测更完整的显著目标.最后,将焦堆栈图像信息和全聚焦图像信息有效融合,以预测最终的显著目标.本文在DUT-LFSD、HFUT-LFSD和LFSD数据集上展开实验,并与28种代表性工作进行对比.结果表明,本文设计的模型效果显著,在多个评价指标上一致地提高了显著目标检测的准确性.定性分析也表明本文提出的方法能够更准确地定位显著目标. 姜文晖 程一波 方玉明 朱旻炜 左一帆关键词:光场 显著性检测 聚合细粒度特征的深度注意力自动裁图 被引量:1 2022年 目的从图像中裁剪出构图更佳的区域是提升图像美感的有效手段之一,也是计算机视觉领域极具挑战性的问题。为提升自动裁图的视觉效果,本文提出了聚合细粒度特征的深度注意力自动裁图方法(deep attention guided image cropping network with fine-grained feature aggregation,DAIC-Net)。方法整体模型结构由通道校准的语义特征提取(semantic feature extraction with channel calibration,ECC)、细粒度特征聚合(fine-grained feature aggregation,FFA)和上下文注意力融合(contextual attention fusion,CAF)3个模块构成,采用端到端的训练方式,核心思想是多尺度逐级增强不同细粒度区域特征,融合全局和局部注意力特征,强化上下文语义信息表征。ECC模块在通用语义特征的通道维度上进行自适应校准,融合了通道注意力;FFA模块将多尺度区域特征级联互补,产生富含图像构成和空间位置信息的特征表示;CAF模块模拟人眼观看图像的规律,从不同方向、不同尺度显式编码图像空间不同像素块之间的记忆上下文关系;此外,定义了多项损失函数以指导模型训练,进行多任务监督学习。结果在3个数据集上与最新的6种方法进行对比实验,本文方法优于现有的自动裁图方法,在最新裁图数据集GAICD(grid anchor based image cropping database)上,斯皮尔曼相关性和皮尔森相关性指标分别提升了2.0%和1.9%,其他最佳回报率指标最高提升了4.1%。在ICDB(image cropping database)和FCDB(flickr cropping database)上的跨数据集测试结果进一步表明了本文提出的DAIC-Net的泛化性能。此外,消融实验验证了各模块的有效性,用户主观实验及定性分析也表明DAIC-Net能裁剪出视觉效果更佳的裁图结果。结论本文提出的DAIC-Net在GAICD数据集上多种评价指标均取得最优的预测结果,在ICDB和FCDB测试集上展现出较强的泛化能力,能有效提升裁图效果。 方玉明 钟裕 鄢杰斌 刘丽霞关键词:多任务学习 视频质量评价研究综述 2023年 移动互联网时代每天都产生海量的质量参差不齐的视频数据,根据视频质量高效地过滤低质量视频对缓解设备存储压力起着至关重要的作用.此外,在视频的生成、处理、传输等过程中都不可避免地引入信号噪声,如何准确地预测视频质量,从而指导与监督视频处理与传输系统的优化具有重要的研究意义和实际价值.因此,视频质量评价受到越来越多的关注.视频质量评价旨在定量描述视频的视觉质量,包括主观质量评价和客观质量评价.主观质量评价通过开展视觉感知主观实验,研究各项因素对视觉质量的影响,并收集主观质量分数用于构建基准数据集;客观质量评价通过设计客观算法,自动预测视频的质量.本文首先介绍视频质量评价的基础知识,阐述视频质量评价的相关应用和问题;其次,重点介绍视频质量评价近二十年的发展现状,对比不同主观数据集的特点;然后,深入解析客观模型的建模思想,分层次对比不同的模型,详细分析各模型的优缺点;最后,指出未来发展方向并总结全文. 鄢杰斌 方玉明 刘学林 姚怡茹 眭相杰关键词:视频质量评价 视觉感知 无参考图像质量评价研究进展 被引量:25 2021年 图像质量评价一直是图像处理和计算机视觉领域的一个基础问题,图像质量评价模型也广泛应用于图像/视频编码、超分辨率重建和图像/视频视觉质量增强等相关领域。图像质量评价主要包括全参考图像质量评价、半参考图像质量评价和无参考图像质量评价。全参考图像质量评价和半参考图像质量评价分别指预测图像质量时参考信息完全可用和部分可用,而无参考图像质量评价是指预测图像质量时参考信息不可用。虽然全参考和半参考图像质量评价模型较为可靠,但在计算过程中必须依赖参考信息,使得应用场景极为受限。无参考图像质量评价模型因不需要依赖参考信息而有较强的适用性,一直都是图像质量评价领域研究的热点。本文主要概述2012—2020年国内外公开发表的无参考图像质量评价模型,根据模型训练过程中是否需要用到主观分数,将无参考图像质量评价模型分为有监督学习和无监督学习的无参考图像质量评价模型。同时,每类模型分成基于传统机器学习算法的模型和基于深度学习算法的模型。对基于传统机器学习算法的模型,重点介绍相应的特征提取策略及思想;对基于深度学习算法的模型,重点介绍设计思路。此外,本文介绍了图像质量评价在新媒体数据中的研究工作及图像质量评价的应用。最后对介绍的无参考图像质量评价模型进行总结,并指出未来可能的发展方向。 方玉明 眭相杰 鄢杰斌 刘学林 黄丽萍关键词:图像质量评价 人类视觉系统 视觉感知 人工智能环境下大学数学的教学模式探讨 被引量:1 2021年 近几年来,人工智能迅速发展,这不仅给人们的生活带来了很大的便利,也给大学数学教育教学带来了变化.本文以人工智能的发展为出发点,分析大学数学的特点,探讨人工智能环境下大学数学的教学模式. 温文媖 方玉明 韩加林关键词:人工智能 大学数学 数学教学 深度学习时代图像融合技术进展 被引量:6 2023年 为提升真实场景视觉信号的采集质量,往往需要通过多种融合方式获取相应的图像,例如,多聚焦、多曝光、多光谱和多模态等。针对视觉信号采集的以上特性,图像融合技术旨在利用同一场景不同视觉信号的优势,生成单图像信息描述,提升视觉低、中、高级任务的性能。目前,依托端对端学习强大的特征提取、表征及重构能力,深度学习已成为图像融合研究的主流技术。与传统图像融合技术相比,基于深度学习的图像融合模型性能显著提高。随着深度学习研究的深入,一些新颖的理论和方法也促进了图像融合技术的发展,如生成对抗网络、注意力机制、视觉Transformer和感知损失函数等。为厘清基于深度学习技术的图像融合研究进展,本文首先介绍了图像融合问题建模,并从传统方法视角逐渐向深度学习视角过渡。具体地,从数据集生成、神经网络构造、损失函数设计、模型优化和性能评估等方面总结了基于深度学习的图像融合研究现状。此外,还讨论了选择性图像融合这类衍生问题建模(如基于高分辨率纹理图融合的深度图增强),回顾了一些基于图像融合实现其他视觉任务的代表性工作。最后,根据现有技术的缺陷,提出目前图像融合技术存在的挑战,并对未来发展趋势给出了展望。 左一帆 方玉明 马柯德关键词:图像融合 图像质量评价 恶劣场景下视觉感知与理解综述 2024年 恶劣场景下采集的图像与视频数据存在复杂的视觉降质,一方面降低视觉呈现与感知体验,另一方面也为视觉分析理解带来了很大困难。为此,系统地分析了国际国内近年恶劣场景下视觉感知与理解领域的重要研究进展,包括图像视频与降质建模、恶劣场景视觉增强、恶劣场景下视觉分析理解等技术。其中,视觉数据与降质建模部分探讨了不同降质场景下的图像视频与降质过程建模方法,涵盖噪声建模、降采样建模、光照建模和雨雾建模。传统恶劣场景视觉增强部分探讨了早期非深度学习的视觉增强算法,包括直方图均衡化、视网膜大脑皮层理论和滤波方法等。基于深度学习模型的恶劣场景视觉增强部分则以模型架构创新的角度进行梳理,探讨了卷积神经网络、Transformer模型和扩散模型等架构。不同于传统视觉增强的目标为全面提升人眼对图像视频的视觉感知效果,新一代视觉增强及分析方法考虑降质场景下机器视觉对图像视频的理解性能。恶劣场景下视觉理解技术部分探讨了恶劣场景下视觉理解数据集和基于深度学习模型的恶劣场景视觉理解,以及恶劣场景下视觉增强与理解协同计算。论文详细综述了上述研究的挑战性,梳理了国内外技术发展脉络和前沿动态。最后,根据上述分析展望了恶劣场景下视觉感知与理解的发展方向。 汪文靖 杨文瀚 方玉明 黄华 刘家瑛关键词:视觉感知 多媒体技术基础课程的学习产出教育模式 被引量:2 2020年 分析目前本科多媒体技术基础课程教学存在的弊端,提出在教学中引入学习产出教育模式,说明该教学模式的关键环节和实施策略,从课程设计、教学组织和教学评价方面介绍教学实践,并对应用效果和问题进行深入探讨。 左一帆 方玉明 沈波关键词:多媒体技术基础 数字图像处理 结合半张量积压缩感知的可验证图像加密 被引量:6 2022年 目的物联网(internet of things,IoT)感知层获取数据时存在资源受限的约束,同时数据常常遭受泄露和非法篡改。数据一旦遭到破坏,将对接收者造成很大的影响,甚至可能会比没有收到数据更加严重。针对IoT数据获取面临的能耗和安全问题,提出一种基于半张量积压缩感知的可验证图像加密方法。方法首先采用级联混沌系统生成测量矩阵和验证矩阵,测量矩阵以半张量积压缩感知的方式进行采样得到观测值矩阵。利用Arnold置乱观测值矩阵得到最终密文信号,与此同时由验证矩阵生成消息验证码一同在公共信道传输,将由级联混沌系统生成的测量矩阵、验证矩阵以及Arnold置乱的参数的初始种子作为密钥在安全信道上传输。结果密钥空间分析、密钥敏感性分析、图像熵分析、直方图分析、相关性分析、身份验证分析、压缩率分析的实验结果显示:相比于两种对比方法,本文算法加密后图像的熵值更接近于8,而对应密文图像像素之间的相关系数更接近于0。结论本文的可验证加密算法结合了半张量压缩感知的优点,在有效减少数据采样能耗的同时保证了数据在传输过程中的安全性与完整性。 温文媖 洪宇坤 方玉明 张玉书 万征关键词:压缩感知 图像加密