您的位置: 专家智库 > >

毛先领

作品数:30 被引量:106H指数:4
供职机构:北京理工大学更多>>
发文基金:国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术文化科学社会学经济管理更多>>

文献类型

  • 20篇专利
  • 7篇期刊文章
  • 2篇会议论文
  • 1篇学位论文

领域

  • 11篇自动化与计算...
  • 3篇文化科学
  • 1篇经济管理
  • 1篇社会学

主题

  • 8篇语言处理
  • 8篇自然语言
  • 8篇自然语言处理
  • 5篇信息检索
  • 5篇主题模型
  • 5篇哈希
  • 5篇标签
  • 5篇抽取
  • 4篇自然语言处理...
  • 4篇网络
  • 4篇处理技术
  • 3篇段落
  • 3篇信息抽取
  • 3篇语料
  • 3篇主题
  • 3篇查询
  • 2篇单词
  • 2篇段落写作
  • 2篇新闻
  • 2篇学术

机构

  • 26篇北京理工大学
  • 6篇北京大学
  • 4篇中电科大数据...
  • 4篇华建宇通科技...
  • 1篇北京师范大学
  • 1篇华南理工大学
  • 1篇浙江大学
  • 1篇中国科学院自...
  • 1篇淘宝(中国)...

作者

  • 30篇毛先领
  • 12篇黄河燕
  • 3篇闫宏飞
  • 2篇何靖
  • 2篇兰天
  • 2篇高小燕
  • 1篇赵鑫
  • 1篇张旭东
  • 1篇李晓明
  • 1篇周新宇
  • 1篇李峰
  • 1篇王昊

传媒

  • 3篇计算机研究与...
  • 1篇广西师范大学...
  • 1篇中文信息学报
  • 1篇中国科技教育
  • 1篇计算机科学与...

年份

  • 3篇2023
  • 1篇2022
  • 7篇2021
  • 3篇2020
  • 4篇2019
  • 4篇2018
  • 3篇2016
  • 1篇2015
  • 2篇2012
  • 2篇2010
30 条 记 录,以下是 1-10
排序方式:
一种基于词组的概念化主题建模方法
本发明涉及一种基于词组的概念化主题建模方法,属于自然语言处理中的文本挖掘领域。包括1)挖掘文本语料中的词组;2)从概念知识库获取概念和实体关系;3)设置主题数、Dirichlet分布先验参数及最大迭代次数N;4)随机为每...
黄河燕唐翼琨史学文毛先领
文献传递
一种基于局部敏感哈希的主题标签快速赋予方法
本发明提出了一种基于局部敏感哈希的主题标签快速赋予方法,属于文本挖掘技术领域。此方法将主题标签赋予问题转换成求K近邻的问题,包含离线数据库构建和在线查询两个部分。其中,离线部分利用标签主题模型对带标签的文档进行处理,得到...
黄河燕毛先领周强任金伟
文献传递
一种生成式的学术论文中相关工作的自动产生方法
本发明一种生成式的学术论文中相关工作的自动产生方法,属于计算机自然语言处理技术领域。具体操作步骤包括:①基于英文学术论文中的相关工作以及相关工作中引用的参考文献的摘要,构建大规模语料集;②根据已经构造好的语料集训练基于残...
毛先领姜晓健冯博思魏骁驰
文献传递
一种生成式的学术论文中相关工作的自动产生方法
本发明一种生成式的学术论文中相关工作的自动产生方法,属于计算机自然语言处理技术领域。具体操作步骤包括:①基于英文学术论文中的相关工作以及相关工作中引用的参考文献的摘要,构建大规模语料集;②根据已经构造好的语料集训练基于残...
毛先领姜晓健冯博思魏骁驰
文献传递
一种基于baseline的期刊评价方法及评价装置
本发明涉及一种基于baseline的期刊评价方法,属于计算机自然语言处理技术领域。此方法首先通过建立期刊的baseline引文的网络,以便计算期刊的baseline评价值V<Sub>baseline</Sub>,然后通过...
黄河燕毛先领刘茜孟德纯
一种基于图注意力机制的PDF表格结构识别方法
本发明涉及一种基于图注意力机制的PDF表格结构识别方法,属于数据挖掘技术中的文档分析技术领域;包括以下步骤:一、预处理:获取表格中的所有单元格以及它们的位置坐标;二、图构建:对得到的单元格建立无向图;三、关系预测:通过对...
毛先领迟泽闻徐恒达
文献传递
一种基于目标检测的无监督深度哈希方法
本发明涉及一种基于目标检测的无监督深度哈希方法,属于计算机信息检索技术以及图片检索技术领域。利用目标检测获得图片中存在的物体标签,并将这些标签作为图片的伪标签,基于伪标签训练设计好的端到端深度哈希模型,得到每张图片在汉明...
毛先领涂荣成黄河燕程序邹佳
文献传递
一种基于自注意力机制的科技写作推荐方法
本发明涉及一种基于自注意力机制的科技写作推荐方法,属于计算机自然语言处理以及社交媒体技术领域。所述科技写作推荐方法,首先利用已有的段落写作内容,挖掘作者写作主题与意图,并以此初步筛选候选段落;其次设计了基于自注意力机制的...
黄河燕高小燕毛先领迟泽闻余厚金兰天
文献传递
基于CLIP生成多事件表示的视频文本检索方法
2023年
视频-文本检索作为一项被广泛应用于现实生活中的多模态检索技术受到越来越多的研究者的关注.近来,大部分视频文本工作通过利用大规模预训练模型中所学到的视觉与语言之间的匹配关系来提升文本视频间跨模态检索效果.然而,这些方法忽略了视频、文本数据都是由一个个事件组合而成.倘若能捕捉视频事件与文本事件之间的细粒度相似性关系,将能帮助模型计算出更准确的文本与视频之间的语义相似性关系,进而提升文本视频间跨模态检索效果.因此,提出了一种基于CLIP生成多事件表示的视频文本检索方法(CLIP based multi-event representation generation for video-text retrieval,CLIPMERG).首先,通过利用大规模图文预训练模型CLIP的视频编码器(ViT)以及文本编码器(Tansformer)分别将视频、文本数据转换成视频帧token序列以及文本的单词token序列;然后,通过视频事件生成器(文本事件生成器)将视频帧token序列(单词token序列)转换成k个视频事件表示(k个文本事件表示);最后,通过挖掘视频事件表示与文本事件表示之间的细粒度关系以定义视频、文本间的语义相似性关系.在3个常用的公开视频文本检索数据集MSR-VTT,DiDeMo,LSMDC上的实验结果表明所提的CLIPMERG优于现有的视频文本检索方法.
涂荣成毛先领孔伟杰蔡成飞赵文哲王红法黄河燕
网页去噪:研究综述被引量:18
2010年
互联网的快速发展已经使得网页数据成为目前各种应用与研究的重要数据源之一.网页数据包含各种内容,如广告、导航条、相关链接、正文等,然而对于不同的研究和应用来说,并非所有内容都是必需的,相反地,不相关的内容反而会影响研究和应用的效果和效率,所以网页去噪是一个基础问题,且是目前热点研究的问题.因此很有必要对网页去噪领域进行总结,以便更好地进行深入研究.首先说明了网页去噪的必要性,并对网页去噪进行了定义和分类,概述了多种网页去噪的方法和框架,然后对评估网页去噪算法所使用的数据集和方法进行了总结,最后讨论了该领域存在的问题和今后的研究方向.
毛先领何靖闫宏飞
关键词:网页去噪数据挖掘网络挖掘信息检索万维网
共3页<123>
聚类工具0