公共文化服务平台

郭丹: 作品数：84 被引量：99H指数：6; 供职机构：合肥工业大学更多>>; 发文基金：国家自然科学基金安徽省自然科学基金中国博士后科学基金更多>>; 相关领域：自动化与计算机技术文化科学电子电信建筑科学更多>>

合作作者

基于GPS信息视频的三维场景重建方法: 本发明公开了一种基于GPS信息视频的三维场景重建方法，其特征是按如下步骤进行：1、构建基于GPS信息的FOV模型集合并去除冗余帧数据；2、构建重建帧矩阵；3、抽取关键帧；4、三维重建所述目标场景。本发明能快速准确地提取视...; 汪萌张鹿鸣郭丹鲁志红

一种基于注意力模型的视频摘要描述生成方法及装置: 本发明公开了一种基于注意力模型的视频摘要描述生成方法及装置，其中方法包括：获取原始视频数据集及对应的视频摘要数据集并处理，提取对应视频帧的时序特征序列；将所述视频帧的时序特征序列输入到视频摘要模型中进行处理，生成对应的语...; 赵烨胡晓斌胡珍珍刘学亮郭丹郭艳蓉吴乐

一种基于目标检测的碗碟清洗设备: 本实用新型公开了一种基于目标检测的碗碟清洗设备，涉及家居设备技术领域，清洗箱的容腔内依次设有清洗区、夹取区和放置区；清洗区处设有具有纵向平移及竖向平移二自由度的移动机构、喷头、清洗舵机和清洗平台，夹取区处设有具有纵向平移...; 郭丹何梓贻倪友炜李坤徐梓鑫马嘉淇罗匡

一种带有通配符和长度约束模式匹配问题的动态剪枝算法被引量：1: 2015年; 近年来,随着生物信息学、信息检索等领域的发展,串模式匹配问题被不断扩展。其中,具有代表性的是在模式中引入可变长度的通配符而形成带有通配符的模式匹配(PMWL)。该问题定义的灵活性给用户提供了方便,却也造成了求解上的困难。因此,如何在多项式时间内得到更好的匹配解成为研究的焦点。提出了一种启发式的小兵算法。小兵算法通过将PMWL问题转化为路径搜索问题,并借鉴动态剪枝思想,在算法搜索的过程中动态地将不可能的匹配位置剪枝,从而提高解的质量。实验在真实DNA序列上进行,并人工生成了196个模式。结果表明,相比于目前最有效的SAIL算法,小兵算法在绝大多数的尾部有重复字符的模式中可以获得更好的匹配解。; 王海平戴玮郭丹; 关键词：通配符剪枝

基于加权运动估计多层次检测的帧率转换算法被引量：2: 2016年; 为了增强帧率转换的有效性,该文提出了一种基于运动估计多层次检测的帧率转换算法。该算法首先利用加权运动估计优化调整的方法检测精确的运动矢量;其次利用码本模型(Codebook model)的运动估计分割检测前景区域;然后利用多级重叠块运动补偿重分类的方法检测能反映物体真实运动轨迹的运动矢量。该过程中,采用了预处理方法保证边缘结构信息的完整性,并且利用重分类和平滑方法对不可靠运动区域进行细化处理,有效地降低了传统方法中的方块效应和重影现象;最后利用运动补偿内插实现帧率转换。实验结果表明:该算法相对于传统方法,更适用于背景复杂或快速运动变化的视频,主观视觉效果和客观评估标准上都有所提高,并且具有很好的适应性。; 沈娟田绪婷郭丹汪萌; 关键词：运动矢量码本模型

一种轻量化个性人脸视觉配音方法: 本发明涉及视觉配音技术领域，公开了一种轻量化个性人脸视觉配音方法，包括：将通用数据集的视频文件中的音频分离，得到音频文件；对音频文件进行语音特征提取，得到驱动音频；对视频文件进行面部特征图像提取和图像帧提取，分别得到面部...; 汤杰辉刘学亮郭丹蔡驿晨张金炎叶雨露

一种基于深度智能交互的室外视障辅助方法: 本发明公开了一种基于深度智能交互的室外视障辅助方法，包括：1.获取图像和语音数据；2.根据图像数据获得深度图；3.基于目标检测网络获取目标信息；4.基于语义分割网络获取路面信息；5.将目标信息和道路信息映射到世界坐标系中...; 郭丹谷纪豪唐申庚肖同欢曹晨曦宋万强

手语识别、翻译与生成综述被引量：12: 2021年; 手语研究是典型的多领域交叉研究课题,涉及计算机视觉、自然语言处理、跨媒体计算、人机交互等多个方向,主要包括离散手语识别、连续手语翻译和手语视频生成。手语识别与翻译旨在将手语视频转换成文本词汇或语句,而手语生成是根据口语或文本语句合成手语视频。换言之,手语识别翻译与手语生成可视为互逆过程。文中综述了手语研究的最新进展,介绍了研究的背景现状和面临的挑战;回顾了手语识别、翻译和生成任务的典型方法和前沿研究;并结合当前方法中存在的问题,对手语研究的未来发展方向进行了展望。; 郭丹唐申庚洪日昌洪日昌; 关键词：机器翻译

运动特征激励的无候选框视频描述定位: 2023年; 目的视频描述定位是视频理解领域一个重要且具有挑战性的任务,该任务需要根据一个自然语言描述的查询,从一段未修剪的视频中定位出文本描述的视频片段。由于语言模态与视频模态之间存在巨大的特征表示差异,因此如何构建出合适的视频—文本多模态特征表示,并准确高效地定位目标片段成为该任务的关键点和难点。针对上述问题,本文聚焦于构建视频—文本多模态特征的优化表示,提出使用视频中的运动信息去激励多模态特征表示中的运动语义信息,并以无候选框的方式实现视频描述定位。方法基于自注意力的方法提取自然语言描述中的多个短语特征,并与视频特征进行跨模态融合,得到多个关注不同语义短语的多模态特征。为了优化多模态特征表示,分别从时序维度及特征通道两个方面进行建模:1)在时序维度上使用跳连卷积,即一维时序卷积对运动信息的局部上下文进行建模,在时序维度上对齐语义短语与视频片段;2)在特征通道上使用运动激励,通过计算时序相邻的多模态特征向量之间的差异,构建出响应运动信息的通道权重分布,从而激励多模态特征中表示运动信息的通道。本文关注不同语义短语的多模态特征融合,采用非局部神经网络(non-local neural network)建模不同语义短语之间的依赖关系,并采用时序注意力池化模块将多模态特征融合为一个特征向量,回归得到目标片段的开始与结束时刻。结果在多个数据集上验证了本文方法的有效性。在Charades-STA数据集和ActivityNet Captions数据集上,模型的平均交并比(mean intersection over union,mIoU)分别达到了52.36%和42.97%,模型在两个数据集上的召回率R@1(Recall@1)分别在交并比阈值为0.3、0.5和0.7时达到了73.79%、61.16%和52.36%以及60.54%、43.68%和25.43%。与LGI(local-global video-text interactions)和CPNet(contextual pyramid network)等方; 郭义臣李坤郭丹; 关键词：计算机视觉

一种基于渐进性视野锥的注视目标估计方法: 本发明公开了一种基于渐进性视野锥的注视目标估计方法，其步骤包括：1、先从目标人物的头部图片估计视线方向；2、利用深度图像构建以目标人物为中心的渐进性关系；3、根据视线方向和渐进性关系生成高质量的视野锥图像；4、结合视野锥...; 郭丹刘飞扬李坤汪萌

郭丹

合作作者

文献类型

领域

主题

机构

作者

传媒

年份

用户反馈

郭丹

合作作者

文献类型

领域

主题

机构

作者

传媒

年份

用户登录

用户反馈