您的位置: 专家智库 > >

李阳

作品数:9 被引量:22H指数:2
供职机构:中国科学院计算技术研究所更多>>
发文基金:国家自然科学基金北京市科技新星计划国家242信息安全计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 9篇中文期刊文章

领域

  • 9篇自动化与计算...

主题

  • 3篇知识
  • 3篇情感分析
  • 2篇知识图
  • 2篇情感词典
  • 2篇命名实体识别
  • 1篇多任务
  • 1篇语言
  • 1篇语言模型
  • 1篇语言生成
  • 1篇知识图谱
  • 1篇社交
  • 1篇社交网
  • 1篇社交网络
  • 1篇情感
  • 1篇情感分类
  • 1篇自然语言
  • 1篇自然语言生成
  • 1篇网络
  • 1篇目标检测
  • 1篇跨语言

机构

  • 9篇中国科学院
  • 6篇扬州大学
  • 3篇国家互联网应...
  • 1篇华南理工大学
  • 1篇江西农业大学
  • 1篇中南林业科技...
  • 1篇中国科学院大...

作者

  • 9篇李阳
  • 6篇高翔
  • 6篇朱俊武
  • 3篇王石
  • 3篇唐积强
  • 2篇王晓岩
  • 2篇沙瀛
  • 1篇徐克付
  • 1篇曾标
  • 1篇王昆
  • 1篇李拥军
  • 1篇徐凯

传媒

  • 5篇计算机科学
  • 1篇电子与信息学...
  • 1篇计算机研究与...
  • 1篇计算机应用研...
  • 1篇计算机工程与...

年份

  • 6篇2023
  • 1篇2014
  • 2篇2012
9 条 记 录,以下是 1-9
排序方式:
KENAOTE:一种知识增强的方面和意见对提取多任务学习模型
2023年
方面和意见对提取旨在根据给定句子提取方面和意见项并匹配关系,然而相关研究通常独立提取方面和意见项,而不识别关系。为了识别方面和意见项关系,提出一种知识增强的方面和意见对提取多任务学习模型。首先使用预训练语言模型为文本生成具有语义信息的词向量,为了实现知识增强的效果,使用遮蔽注意力的方式将知识图谱的语义信息融入词向量中,然后使用基于距离注意力和条件随机场的序列标注方法提取方面和意见项,最后再将提取的方面和意见项两两匹配预测对应关系。为了加强方面和意见项提取模块和匹配模块的联系,采用共享编码层的方式实现联合训练。在训练流程中,匹配模块采用真实标签作为输入,在测试过程中采用提取模块的结果作为输入。为了证明模型的有效性,使用三个通用领域数据集进行对比实验,该模型在方面和意见项匹配任务中F 1值分别达到66.99%、75.17%和67.30%,并优于其他比较模型。
李阳李阳唐积强朱俊武高翔
知识增强的自然语言生成研究综述被引量:2
2023年
自然语言生成(Natural Language Generation,NLG)任务是自然语言处理(Natural Languge Processing,NLP)任务中的一个子类,并且是一项具有挑战性的任务。随着深度学习在自然语言处理中的大量应用,其已经变成自然语言生成中处理各种任务的主要方法。自然语言生成任务中主要有问答任务、生成摘要任务、生成评论任务、机器翻译任务、生成式对话任务等。传统的生成模型依赖输入文本,基于有限的知识生成文本。为解决这个问题,引入了知识增强的方法。首先介绍了自然语言生成的研究背景和重要模型,然后针对自然语言处理归纳介绍了提高模型性能的方法,以及基于内部知识(如提取关键词增强生成、围绕主题词等)和外部知识(如借助外部知识图谱增强生成)集成到文本生成过程中的方法和架构。最后,通过分析生成任务面临的一些问题,讨论了未来的挑战和研究方向。
梁明轩王石朱俊武李阳李阳焦志翔
关键词:自然语言生成知识图谱关键词提取
命名实体识别任务综述
2023年
命名实体识别作为自然语言处理中一项十分基础的任务,为其他许多下游任务的高效完成奠定了基础。其目的是从一段用自然语言描述的文本中识别出相应的实体并标注其类型,以此为其他相关任务作出数据标注的准备。首先介绍了命名实体识别任务的发展历程以及在对应背景下相关研究用到的重点方法,包括自诞生初期用到的基于规则和字典的方法以及后期发展衍生出的基于统计学、深度学习的方法。其次总结了一些该领域比较主流的研究方向,包括低资源条件下的命名实体识别、嵌套命名实体识别以及跨语言的命名实体识别等,这些方向都是近期该任务的热门研究趋势,包含了该任务目前最为流行的研究方法。最后总结了研究中的相关经验,展望了该任务未来的发展方向及难点。
高翔高翔王石朱俊武李阳焦志翔
关键词:命名实体识别跨语言
方面级情感分析综述
2023年
情感分析是自然语言处理领域的重要分支之一。随着时代的发展,为了能从文本数据中提取出更多的情感信息,方面级情感分析在情感分析中的关注度越来越高。首先介绍方面级情感分析的背景知识、相关概念,并从方面抽取和方面情感分类两个子任务角度进行阐述。在方面抽取方面,介绍了基于相似度算法、主题模型和序列标注的相关方法。在方面情感分类方面,介绍了基于情感词典与规则、机器学习和深度学习的相关方法,并整理了方面级情感分析中常用的中英文数据集和情感字典,最后对方面级情感分析目前面临的挑战和未来的发展方向做出总结和展望。
李阳李阳王石朱俊武高翔焦志翔
关键词:情感分析情感词典
基于prompt和知识增强的方面级情感分析
2023年
方面级情感分析是一种新兴的细粒度情感分析任务,旨在根据给定句子和方面词判断情感极性。目前广泛使用的预训练语言模型由于训练目标和方面级情感分析的目标有差异,分析结果不好。为了缓解预训练语言模型和情感分析目标的差异,prompt被引入到方面级情感分析中,采用伪标签加方面词和意见词的方式创建prompt连续模板,并使用prompt-encoder训练伪标签使其拥有语义信息;然后,使用主题图注意力机制融合关于方面词和意见词的外部知识,根据融合外部知识的隐藏向量预测由情感词典组成的候选标签词;最后,采用求和置信度分数的方式将候选标签词的概率映射到情感极性分布空间上。实验表明,该模型在SemEval 2014任务的笔记本电脑数据集和餐厅数据集上将正确率分别提高了1.53%和3.5%。
李阳李阳唐积强朱俊武高翔
关键词:PROMPT情感词典
复杂背景下基于贝叶斯-全概率联合估计的前景检测被引量:10
2012年
针对复杂背景下前景提取较为困难或者提取准确率较低等问题,该文提出了基于贝叶斯-全概率联合估计的目标检测模型并引入了背景误差控制变量的概念。通过选择适当的特征向量,在贝叶斯-全概率估计模型下,背景像素将会分为静止与运动两种不同的类型,进而准确提取前景像素点。实验结果表明,该模型是一个较为通用的目标检测模型,在目标提取时,该文算法对各种类型的视频背景环境(包括复杂背景)都具有较好的适用效果。
李拥军曾标徐克付李阳
关键词:目标检测
基于社交网络的安全关系研究被引量:10
2012年
社交网络面临着许多的安全问题,目前大部分的研究主要集中于社交网络中的(核心)节点、关系、结构等方面,因此"安全关系"的研究显得尤为重要.通过分析安全风险与发生事件之间的关联,采取等级划分、数值度量、多态数据融合、逻辑关联等因素下定性与定量相结合的计算机制,提出了一种基于贝叶斯网络的社交网络安全关系态势评估模型,为社交网络上安全态势的感知与预测提供理论依据.
李阳王晓岩王昆沙瀛
关键词:社交网络贝叶斯网络
Twitter中重复消息的分析和处理
2014年
Twitter已经成为微博中的代表性应用,但是通过分析发现twitter上的消息(推文)有很多完全一致或相似,这对后续对推文的分析和存储都带来很大的问题。为了处理这些内容完全一致或相似的消息(推文),针对推文特有的短文本的特点,基于规则处理完全一致的推文,采用simhash的方法来处理相似性的推文。实验采用实际抓取的240万条推文数据进行分析和处理,分别对中文和英文的推文重复情况进行了分析,实验结果发现重复的推文占总推文的10%左右。
徐凯沙瀛李阳单既喜王晓岩
基于知识增强的命名实体识别方法研究
2023年
命名实体识别作为自然语言处理中一项十分基础的任务,其目的是从一段用自然语言描述的文本中识别出相应的实体及类型。知识图谱作为以三元组形式存在的外部知识,已经在很多自然语言处理任务中得以应用并取得了良好效果。文中提出了一种基于知识图谱信息增强的注意力对齐命名实体识别方法,首先通过嵌入层和注意力机制嵌入知识图谱信息,获取知识图谱三元组信息的表示;其次通过BERT-BiLSTM获取句子的上下文表示;然后通过一种注意力对齐模块分配三元组权重融合知识图谱信息与句子信息的表示;最后通过softmax控制融合后的表示向量的预测输出,进而获取实体的标签。该方法有效避免了因知识图谱的融合而改变原句子的语义信息,同时也使得句子中的词向量具有丰富的外部知识。所提方法在中文通用数据集MSRA和医疗领域专用数据集Medicine上的F1值分别达到了95.73%和93.80%,相比基线模型提升了1.21%和1.3%。
高翔高翔唐积强朱俊武李阳
关键词:命名实体识别
共1页<1>
聚类工具0