赵启军 作品数:84 被引量:65 H指数:4 供职机构: 四川大学 更多>> 发文基金: 国家自然科学基金 国家重大科学仪器设备开发专项 四川省科技计划项目 更多>> 相关领域: 自动化与计算机技术 电子电信 医药卫生 生物学 更多>>
一种基于孪生网络的RGBD显著物体检测方法 本发明公开了图像处理与计算机视觉技术领域的一种基于孪生网络的RGBD显著物体检测方法,步骤包括:1,获取待检测图片的RGB图和深度图;2,将RGB图和深度图输入“孪生网络‑解码器”神经网络,输出RGBD显著性检测结果,“... 傅可人 范登平 赵启军文献传递 基于深度网络层次化与多任务训练的显著性物体检测方法 本发明公开了图像处理与计算机视觉技术领域的一种基于深度网络层次化与多任务训练的显著性物体检测方法,步骤包括:1、确定与显著性物体检测任务相关联的一个或多个任务;2、选取多任务训练图片;3、对层次化特征的深度神经网络进行联... 傅可人 赵启军文献传递 一种自动化正畸难度系数评估方法 本发明公开了一种自动化正畸难度系数评估方法,包括:获取待评估口腔的牙齿模型,并对所述牙齿模型的数据进行优化处理生成第一牙齿数据;从所述第一牙齿数据提取细粒度的数据特征作为第二牙齿数据;对所述第二牙齿数据进行分割平滑处理形... 赵启军 吴晓 刘钧 韦明颖文献传递 用于液体灌注的智能调控方法 本发明公开了一种用于液体灌注的智能调控方法,包括以下步骤:控制恒温电换热管工作直至稳定至所需温度;连通灌注针和目标灌注区域;获取目标灌注区域的乳酸含量作为第一乳酸数据发送至控制系统,获取目标灌注区域的温度发送至控制系统;... 潘帆 赵启军 钱永军基于回归的指纹方向场估计 被引量:2 2017年 指纹方向场对指纹的奇异点检测、特征提取和匹配、分类识别等至关重要。可靠地估计指纹方向场至今为止仍是一个具有挑战性的问题。现有方法一般先估计初始方向场,再对其进行去噪或者正则化处理。受最新的深度学习技术的启发,提出一种基于回归的端到端指纹方向场估计算法。该算法直接建立指纹图像块的纹理特征与其中心位置的脊线方向之间的映射关系。利用总变差模型分解指纹图像,以去除噪音的干扰;将指纹图像分成若干块,并利用深度卷积神经网络学习这些块的纹理特征与其中心位置脊线方向之间的回归函数。为评估文中算法的有效性,使用NIST SD14数据库中的指纹作为训练数据,在FVC2002和FVC2004数据库上进行测试。实验结果表明:与已有的算法相比,该算法不仅简单易操作,而且具备较好的抗噪能力,可以准确地估计出奇异点及其周围的方向场,能够有效提高指纹识别率。 戴晓薇 赵启军关键词:指纹方向场 卷积神经网络 基于自然背景下的藏药材植株识别研究 2022年 藏药材植株的分类识别是藏药材信息化建设的重要内容。早期的藏药材植株识别要依靠人工进行鉴别,极易出错且工作量较大。文章提出一种基于残差网络(Residual Network,ResNet)结合注意力机制的藏药材植株识别模型。实验结果表明,该方法对33种自然场景下藏药材植株图像的识别准确率达到92.3%,优于其他中草药自动识别方法,可有效应用于自然场景下的藏药材植株自动识别,对于藏药材信息化建设工作具有较好的推进作用。 周丽媛 高红梅 高定国 赵启军关键词:藏药材 图像识别 基于深度特征融合的鸟鸣识别方法及其可解释性分析 被引量:2 2023年 鸟鸣识别是生态监测的重要手段,为进一步提升鸟鸣识别的准确性和鲁棒性,本文提出了1种新的基于深度特征融合的鸟鸣识别方法。该方法首先利用深度特征提取网络对鸟鸣的对数梅尔谱图和补充特征集的深度特征进行提取,再将两种深度特征进行融合,最后使用轻量级梯度提升机(light gradient boosting machine,light GBM)分类器进行分类。本文充分利用深度神经网络的特征提取能力以及light GBM的分类性能,将特征提取和特征分类过程进行分离,从而实现了高准确率的鸟鸣识别。实验结果显示,本文提出的方法在北京百鸟数据集中取得了目前已知的最佳结果,模型的平均准确率达到了98.70%,平均F1分数达到了98.84%。相比传统方法,深度融合特征在鸟鸣识别任务上准确率提升了5.62%以上。同时,引入的light GBM分类器使分类准确率提升了3.02%。此外,在CLO-43SD和Bird CLEF2022比赛的数据集中,本文方法也展现出卓越的性能,分别取得了98.32%和91.12%的平均准确率。本文还引入了类激活图对不同类型鸟鸣的识别结果进行可解释性分析,揭示了神经网络对不同类型鸟鸣的注意力区域差异,为后续的特征选择和模型优化提供了理论依据。研究结果表明,本文方法有效提高了鸟鸣识别的准确率,在3个数据集的测试中均展现出较好的性能,能够为基于鸟鸣识别的生态监测提供有力的技术支撑。 蔡建民 何培宇 杨智鹏 李露莹 赵启军 潘帆一种基于SAM的文本信息驱动的行人检索方法及系统 本发明公开了一种基于SAM的文本信息驱动的行人检索方法及系统,应用于图像识别技术,方法包括:形成图像编码和文本编码;进行细粒度跨模态对齐,并生成跨模态对比损失函数;构建遮蔽语言建模损失函数和遮蔽图像建模损失函数;构建二元... 邓钰川 赵启军 傅可人 叶礼斌 邓宗永一种基于3D卷积神经网络的RGBD显著性物体检测方法 本发明公开了一种基于3D卷积神经网络的RGBD显著性物体检测方法,步骤包括,获取待检测图片的RGB图和深度图,并将深度图转换为三通道,将三通道的RGB图和深度图在时间维度进行串联,输出带时间维度的4D张量,将4D张量输入... 傅可人 陈倩 赵启军文献传递 结构先验指导的文本图像修复模型 2023年 目的图像修复是根据图像中已知内容来自动恢复丢失内容的过程。目前基于深度学习的图像修复模型在自然图像和人脸图像修复上取得了一定效果,但是鲜有对文本图像修复的研究,其中保证结构连贯和纹理一致的方法也没有关注文字本身的修复。针对这一问题,提出了一种结构先验指导的文本图像修复模型。方法首先以Transformer为基础,构建一个结构先验重建网络,捕捉全局依赖关系重建文本骨架和边缘结构先验图像,然后提出一种新的静态到动态残差模块(static-to-dynamic residual block,StDRB),将静态特征转换到动态文本图像序列特征,并将其融合到编码器—解码器结构的修复网络中,在结构先验指导和梯度先验损失等联合损失的监督下,使修复后的文本笔划连贯,内容真实自然,达到有利于下游文本检测和识别任务的目的。结果实验在藏文和英文两种语言的合成数据集上,与4种图像修复模型进行了比较。结果表明,本文模型在主观视觉感受上达到了较好的效果,在藏文和英文数据集上的峰值信噪比和结构相似度分别达到了42.31 dB,98.10%和39.23 dB,98.55%,使用Tesser⁃act OCR(optical character recognition)识别修复后藏文图像中的文字的准确率达到了62.83%,使用Tesseract OCR、CRNN(convolutional recurrent neural network)以及ASTER(attentional scene text recognizer)识别修复后英文图像中的文字的准确率分别达到了85.13%,86.04%和76.71%,均优于对比模型。结论本文提出的文本图像修复模型借鉴了图像修复方法的思想,利用文本图像中文字本身的特性,取得了更加准确的文本图像修复结果。 刘雨轩 赵启军 潘帆 潘帆 普布旦增关键词:图像修复