白琮 作品数:17 被引量:113 H指数:5 供职机构: 浙江工业大学计算机科学与技术学院、软件学院 更多>> 发文基金: 国家自然科学基金 浙江省自然科学基金 国家科技支撑计划 更多>> 相关领域: 自动化与计算机技术 文化科学 理学 一般工业技术 更多>>
一种基于滑动差分的车辆边缘检测新方法 被引量:1 2008年 在基于视频的交通监控系统中,车辆的快速、有效提取是车辆检测中的一个重要环节。在彩色图像中,当车辆出现在道路上时,因为车辆与道路相比颜色上有较大的差异,所以在车辆的边缘像素点上会发生颜色的突变。本文以此为依据,结合车辆的几何信息,提出了一种新的车辆提取算法。此方法通过对彩色图像进行逐行扫描的方式,利用滑动差分滤波器,确定每行的车辆边缘像素点,进而将车辆从图像中提取出来。实验证明,该方法能简单有效地提取车辆。 白琮 寇超 陈泉林关键词:RGB色彩空间 在彩色视频图像中提取车辆的方法 本发明公开了一种在彩色视频图像中提取车辆的方法。本方法的步骤为1)建立特征向量空间:利用对每个像素点的r、g、b值求模值的方法,并求背景帧和当前帧的模值之比,将三维的特征空间转为一维的特征空间。2)建立状态特征矩阵:根据... 白琮 寇超 陈泉林 洪亮 李继豪文献传递 基于条件生成对抗网络的图像描述生成方法 被引量:13 2020年 图像描述,即利用电脑自动描述图像的语义内容一直是计算机视觉领域的一项重要研究任务.尽管使用卷积神经网络(convolutional neural networks, CNN)和长短期记忆网络(long short-term memory, LSTM)的组合框架在生成图像描述方面解决了梯度消失和梯度爆炸问题,但是基于LSTM的模型依赖序列化的生成描述,无法在训练时并行处理,且容易在生成描述时遗忘先前的信息.为解决这些问题,提出将条件生成对抗网络(conditionalgenerativeadversarial network, CGAN)引入到描述生成模型训练中,即采用CNN来生成图像描述.通过对抗训练来生成句子描述,并结合注意力机制提升描述的质量.在MSCOCO数据集上进行测试,实验结果表明,与基于CNN的其他方法相比,文中方法在语义丰富程度指标CIDEr上取得了2%的提升,在准确性指标BLEU上有1%左右的性能提升;同时,其在部分指标,尤其是语义指标上超过了基于LSTM模型的图像描述方法的性能;证明该方法生成的图像描述更接近图像的真实描述,并且语义内容更加丰富. 黄远 白琮 李宏凯 张敬林 陈胜勇关键词:图像描述 卷积神经网络 结合多层特征及空间信息蒸馏的医学影像分割 2022年 U-Net在医学影像分割领域是目前应用最广泛的分割模型,其“编码-解码”结构也成为了构建医学影像分割模型最常用的结构。尽管U-Net在许多领域实现了非常高的分割准确度,但是存在着计算复杂度高、推理速度慢、运行消耗内存大等问题,导致其难以在移动应用平台部署。为解决这一问题,提出了一种结合多层特征及空间信息蒸馏的医学影像分割方法TinyUnet。该方法使用轻量化的U-Net作为学生网络。考虑到小模型没有足够的学习能力,通过选择合适的蒸馏位置,对多层教师特征图进行蒸馏;同时加强教师网络深层特征图的边缘,并构建边缘关键点图结构,采用图卷积网络对学生网络进行空间信息蒸馏,从而补充重要的边缘信息和空间信息。实验表明:在3个医学影像数据集上,TinyUnet能够达到U-Net 98.3%~99.7%的分割准确度,但是将U-Net的参数量平均降低了99.6%,运算速度提高了约110倍;同时,与其他轻量化医学影像分割模型相比,TinyUnet不仅具有较高的分割准确度,而且占用内存更少,运行速度更快。 郑宇祥 郝鹏翼 吴冬恩 白琮关键词:空间信息 组加权约束的核稀疏表示分类算法 被引量:4 2016年 提出了一种称为核加权组稀疏表示分类器(kernel weighted group sparse representation classifier,KWGSC)的新型模式分类算法.通过在核特征空间而非原输入空间引入组稀疏性和保局性,KWGSC能够获得更有效的鉴别性重构系数用于分类表示.为获得最优重构系数,提出了一种新的迭代更新策略进行模型求解并给出了相应的收敛性证明以及复杂度分析.对比现存表示型分类算法,KWGSC具有的优势包括:1)通过隐含映射变换,巧妙地规避了经典线性表示算法所固有的规范化问题;2)通过联合引入距离加权约束和重构冗余约束,精确地推导出查询样本的目标类别标签;3)引入l2,p正则项调整协作机制中的稀疏性,获得更佳的分类性能.人造数值实验表明:经典线性表示型算法在非范数归一化条件下无法找到正确的重构样本,而KWGSC却未受影响.实际的公共数据库验证了所提分类算法具有鲁棒的鉴别力,其综合性能明显优于现存算法. 郑建炜 杨平 王万良 白琮关键词:核技术 面向细粒度草图检索的对抗训练三元组网络 被引量:2 2020年 将草图作为检索示例用于图像检索称为基于草图的图像检索,简称草图检索.其中,细粒度检索问题或类内检索问题是2014年被研究者提出并快速成为广受关注的研究方向.目前研究者通常用三元组网络来解决类内检索问题,且取得了不错的效果.但是三元组网络的训练非常困难,很多情况下很难收敛甚至不收敛,且存在着容易过拟合的风险.借鉴循环生成对抗训练的思想,设计了SketchCycleGAN帮助提高三元组网络训练过程的效率,以对抗训练的方式使其参与到三元组网络的训练过程中,通过充分挖掘数据集自身信息的方式取代了利用其他数据集进行预训练的过程,在简化训练步骤的基础上取得了更好的检索性能.通过在常用的细粒度草图检索数据集上的一系列对比实验,证明了所提方法的有效性和优越性. 陈健 白琮 马青 马青 郝鹏翼张量环因子非凸秩约束的高光谱图像超解析 被引量:6 2022年 针对高光谱图像超解析问题,提出了一种联合子空间表示、非局部相似性和张量环因子非凸秩约束的超谱-多谱融合模型。首先,基于高光谱图像的全局谱低秩特性,利用原始低空间分辨率高光谱谱域信息将其降维至子空间表示;随后,针对视觉对像在非局部维度上的强相关性,利用多光谱图像的空间冗余信息将降维后子空间图分成多个相似patch组,并对其施加张量环分解挖掘低秩信息。其中,对分解因子添加基于t-SVD的张量核范数约束,并利用非凸log函数逼近本质秩函数,代替传统凸张量核范数约束,在保持其光谱-空间结构的基础上,避免凸函数过度惩罚较大奇异值所导致的有偏解问题。最后,建立完整的融合模型,并采用交替方向乘子法进行变量优化求解。通过多组实验进行验证,结果表明所提模型提高了视觉质量,与现有最新的融合模型相比,该方法在定量评价的数值结果上也有明显优势。新模型充分考虑了高光谱图像的全局谱低秩性,并结合了非局部相似先验与张量环分解的非凸张量因子秩,能够有效实现高光谱图像的超分辨率重构。 郑建炜 周鑫杰 徐宏辉 秦梦洁 白琮关键词:高光谱图像 超分辨率重构 复杂场景中单个人脸的实时跟踪方法 本发明涉及一种针对复杂场景中单个人脸的实时跟踪方法。本方法步骤为:(1)画面预处理:对视频捕获的画面进行线形变换和高斯模板滤波;(2)利用肤色特征进行人脸检测:利用肤色在YCrCb色彩空间中的聚合性对人脸进行检测并进行形... 寇超 白琮 陈泉林 王华红 王少波文献传递 面向大规模图像分类的深度卷积神经网络优化 被引量:63 2018年 在图像分类任务中,为了获得更高的分类精度,需要对图像提取不同层次的特征信息.深度学习被越来越多地应用于大规模图像分类任务中.提出了一种基于深度卷积神经网络的、可应用于大规模图像分类的深度学习框架.该框架在经典的深度卷积神经网络AlexNet基础上,分别从网络框架和网络内部结构两个方面对网络进行了优化和改进,进一步提升了网络的特征表达能力.同时,通过在全连接层引入隐层,使得网络能够同时具备学习图像特征和二值哈希的功能,从而使该框架具有处理大规模图像数据的能力.通过在3个标准数据库中的一系列比对实验,分析了不同优化方法在不同情况下的作用,并证明了所提优化方法的有效性. 白琮 黄玲 陈佳楠 潘翔 陈胜勇关键词:图像分类 激活函数 结合多通道注意力的糖尿病性视网膜病变分级 被引量:7 2021年 目的糖尿病性视网膜病变(diabetic retinopathy,DR)是一种常见的致盲性视网膜疾病,需要患者在早期就能够被诊断并接受治疗,否则将会造成永久性的视力丧失。能否检测到视网膜图像中的微小病变如微血管瘤,是糖尿病性视网膜病变分级的关键。然而这些病变过于细小导致使用一般方法难以正确地辨别。为了解决这一问题,本文提出了一种基于多通道注意力选择机制的细粒度分级方法(fine-grained grading method based on multichannel attention selection,FGMAS)用于糖尿病性视网膜病变的分级。方法该方法结合了细粒度分类方法和多通道注意力选择机制,通过获取局部特征提升分级的准确度。此外考虑到每一层通道特征信息量与分类置信度的关系,本文引入了排序损失以优化每一层通道的信息量,用于获取更加具有信息量的局部区域。结果使用两个公开的视网膜数据集(Kaggle和Messidor)来评估提出的细粒度分级方法和多通道注意力选择机制的有效性。实验结果表明:FGMAS在Kaggle数据集上进行的五级分类任务中相较于现有方法,在平均准确度(average of classification accuracy,ACA)上取得了3.4%~10.4%的提升。尤其是对于病变点最小的1级病变,准确率提升了11%~18.9%。此外,本文使用FGMAS在Messidor数据集上进行二分类任务。在推荐转诊/不推荐转诊分类上FGMAS得到的准确度(accuracy,Acc)为0.912,比现有方法提升了0.1%~1.9%,同时AUC(area under the curve)为0.962,比现有方法提升了0.5%~9.9%;在正常/不正常分类上FGMAS得到的准确度为0.909,比现有方法提升了2.9%~8.8%,AUC为0.950,比现有方法提升了0.4%~8.9%。实验结果表明,本文方法在五分类和二分类上均优于现有方法。结论本文所提细粒度分级模型,综合了细粒度提取局部区域的思路以及多通道注意力选择机制,可以获得较为准确的分级结果。 顾婷菲 郝鹏翼 白琮 白琮关键词:局部特征提取