您的位置: 专家智库 > >

牛耘

作品数:28 被引量:63H指数:5
供职机构:南京航空航天大学计算机科学与技术学院更多>>
发文基金:国家自然科学基金国家教育部博士点基金国家重点基础研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 24篇期刊文章
  • 4篇专利

领域

  • 25篇自动化与计算...

主题

  • 11篇蛋白
  • 11篇蛋白质
  • 11篇白质
  • 7篇情绪
  • 7篇向量
  • 5篇情绪分析
  • 5篇中文
  • 4篇单词
  • 3篇语料
  • 3篇支持向量
  • 3篇支持向量机
  • 3篇上下文
  • 3篇情绪词
  • 3篇网络
  • 3篇网络传播
  • 3篇向量机
  • 3篇聚类
  • 3篇混合模型
  • 3篇K近邻
  • 3篇词典

机构

  • 28篇南京航空航天...
  • 1篇华中科技大学

作者

  • 28篇牛耘
  • 10篇魏欧
  • 5篇吴红梅
  • 4篇王宇伟
  • 3篇余鹏
  • 3篇蔡昕烨
  • 3篇张景
  • 3篇刘宝芹
  • 2篇封二英
  • 2篇潘明慧
  • 1篇黄志球
  • 1篇范大娟
  • 1篇韩兰胜
  • 1篇张黎

传媒

  • 14篇计算机技术与...
  • 3篇计算机工程与...
  • 3篇计算机科学
  • 1篇计算机工程
  • 1篇计算机应用
  • 1篇中文信息学报
  • 1篇计算机科学与...

年份

  • 2篇2019
  • 5篇2018
  • 3篇2017
  • 4篇2016
  • 8篇2015
  • 3篇2014
  • 1篇2013
  • 2篇2012
28 条 记 录,以下是 1-10
排序方式:
基于情绪强度的中文微博情绪分析被引量:2
2015年
由于中文情绪表达的多样性,以及微博情绪的丰富性和敏感性,情绪词在表达情绪时存在强弱差别,相同的情绪词在不同的语料语境中也可能表达不同的情绪强度。因此文中提出了基于情绪强度的中文微博情绪分析,并根据语料上下文计算出情绪词的情绪相似度,基于情绪相似度自动标注了情绪强度,利用情绪强度进行微博文本的情绪分析。实验结果表明,对情绪词进行情绪强度的标注可以更细致地识别出微博中的主要情绪,进一步提高微博情绪分析的准确率。
王世泓牛耘
关键词:情绪词
基于多层次语言特征的弱监督评论倾向性分析被引量:3
2015年
该文提出一种基于多层次语言特征的弱监督的情感分析方法,先以少量情感词构成初始情感词典,用这些种子词汇作引导,根据评论文本在单词、短语及句子级别的语言特征结合上下文挖掘目标文本中潜在的具有情感倾向的词汇/短语。通过自训练不断扩充情感词典,最终得到一个具有领域特征的情感词典,并用所得到的情感词典对目标文本的情感倾向进行判断。与其他方法在同一数据上的结果相比,该方法以很小的词典规模取得了最高的F-score,并且得到的情感词含义明确。方法用于不同领域也取得了较高的精度,表明方法具有较好的领域适应性。
牛耘张黎王世泓魏欧
关键词:情感分析情感词典
基于词频统计的蛋白质交互关系识别被引量:2
2019年
目前,基于远监督的蛋白质交互关系抽取方法通过将知识库中的实体对与文本中的实体进行匹配来产生大规模的训练数据,有效地解决了标注数据不足的问题。在基于最大期望算法的蛋白质交互识别的基础上,提出了一种基于词频统计的蛋白质交互关系识别。该方法对每一个蛋白质对签名档进行处理,取出两个目标蛋白质中间的单词;然后对其进行词性标注,只保留名词和动词,同时进行词干提取;最终得到每个蛋白质对签名档下的词频统计。利用得到的词频信息设定阈值来获取签名档的高频词,改进最大期望算法的初始化过程。实验结果表明,通过加入高频词信息的干预来进一步获取句子的类别作为初始值较原始的基于最大期望算法的模型,取得了更高且均衡的精确度和召回率,对目前基于远监督的蛋白质交互关系识别方法进行了明显的改进。
蔡松成牛耘
关键词:最大期望算法词频统计
多层次中文微博情绪分析被引量:5
2015年
文中旨在对中文微博文本中表达的情绪进行自动分析。目前,微博情绪分析的方法主要是平面型分类方法。该方法认为各个情绪类之间相互独立,相互并列,它们处在同一个平面层次上,只需要一次性构建一个分类器就可以完成情绪分类任务。事实上,Ekman六类情绪之间的关系并不完全独立。文中将Ekman六类情绪按照情感极性及情绪间的相互关系组织成三层树状结构,在此基础上提出了一种基于朴素贝叶斯模型的多层次中文微博情绪分析方法。实验结果表明,与传统的平面型朴素贝叶斯分类方法相比,文中提出的多层次微博情绪分析方法降低了各情绪类微博分布不平衡对分类结果造成的影响,提高了微博情绪识别的精度。
刘宝芹牛耘
关键词:朴素贝叶斯
基于关键词的蛋白质交互关系识别
2019年
蛋白质交互关系(PPI)是生物医学领域的重要研究内容之一,目前通过生物医学实验得到的PPI信息主要以文本的形式存储在相关文献中。随着生物医学文献数量的飞速增长,人工识别PPI的方式已经难以满足实际应用需求。文中采用基于弱监督的PPI识别基础框架,以少量有交互关系的蛋白质对作为种子集,通过对种子集的不断迭代扩充,最终实现蛋白质交互关系识别。相比于现有的其他方法,该方法仅需少量有标注数据实现了较好的识别效果,节省了大量人力物力。在此基础上,利用词向量对现有的表达交互关系的关键词进行扩充,并对关键词的可靠性进行评分,根据扩充后的关键词集合对基础框架的聚类过程做了改进,将聚类的输入词汇模式集合根据所包含的关键词分数做降序排序。实验结果表明,基础的PPI识别框架仅有少量有标注数据取得了较好的结果,在此基础上改进后的关键词扩充算法进一步提高了PPI识别结果,第一次迭代后的F值最高为67.20%,比改进前的算法提高了1.54%,三次迭代后的F值为69.05%。
毛宇薇牛耘
关键词:关键词
基于大规模文本的蛋白质交互关系自动提取被引量:6
2012年
针对目前蛋白质交互(PPI)关系提取方法仅以单句中的信息为主要依据的问题,提出一种基于大规模文本的蛋白质交互关系自动提取的方法。首先通过对大规模生物医学文本的自动搜索建立目标蛋白质对的签名档,将蛋白质交互关系抽取转化为文本自动分类问题;然后提取签名档中的重要特征,建立蛋白质对的向量空间模型(VSM);最后采用支持向量机(SVM)对签名档进行分类。比较了四种对向量的特征进行加权和特征选择的方案。实验表明,基于大规模文本的蛋白质交互关系识别取得了最高达94.8%的精确度和65.1%的召回率;并且此方法充分利用已有的交互信息,免除了额外的人工标注的负担。
封二英牛耘魏欧
关键词:向量空间模型支持向量机文本分类
基于关系相似性的蛋白质交互自动识别被引量:4
2013年
针对目前蛋白质交互关系识别主要以单句为依据、因标注数据缺乏而导致训练集规模小等不足,提出一种以关系相似性分析为框架、基于大规模文本的蛋白质交互关系自动识别方法。首先通过对大规模生物医学文本数据库的自动搜索获取描述蛋白质对的句子集合,然后分别从单词、短语结构、依赖关系3个角度抽取特征,建立向量空间模型来表示一对蛋白质之间的关系,最后根据两个向量之间的相似性对关系作出判断。所需训练数据直接取自现有蛋白质交互网络,无需任何额外的人工标注。实验表明,基于关系相似性的蛋白质交互关系自动识别取得了较高的精度(F-score 74.2%)。
封二英牛耘魏欧蔡昕烨
关键词:句法分析空间向量模型
基于分布式假设的弱监督蛋白质交互关系识别
2018年
蛋白质交互(protein-protein interaction)是生物医学领域一项重要的研究内容,目前由生物医学进行的PPI实验结果主要以文献的形式存储,随着生物医学文献的大量增加,以手工收集信息的方式已经难以满足实际需求。对此,提出一种基于分布式假设的弱监督蛋白质交互识别方法。首先,从描述蛋白质交互关系的上下文中提取表达语义关系的词汇模式,以少量有交互关系的蛋白质对构成初始种子集,基于分布式假设理论,根据词汇模式在种子集中的分布构建向量空间模型。然后依据相似性对词汇模式进行聚类,形成具有语义相似性的模式簇,利用这些簇在语料中找到新的具有相似分布的模式加入候选集。最后对候选集里的蛋白质对及其模式进行评估,挑选出满足条件的蛋白质对加入种子集进行迭代,最终得到有交互关系的蛋白质对。相比于现有方法,该方法考虑了上下文的语义相关性,实验结果表明,该方法以很小的种子集规模取得了较高的精确度与召回率。
毛宇薇牛耘
基于文本关系相似性的蛋白质交互关系识别方法
本发明公开了一种基于文本关系相似性的蛋白质交互关系识别方法,包括如下步骤:步骤1:获取文本集中的蛋白质对关键词的句子,对所有句子进行集合得到签名档S;每个蛋白质对为(p1,p2),每个目标蛋白质对都会有签名档与其相对应;...
牛耘王宇伟吴红梅魏欧
基于词向量的特征词选择被引量:1
2018年
蛋白质交互信息有助于解决大量医学难题,这些信息都被记录在医学文献中,而每年的生物医学文献都在急剧增加,以手工收集信息的方式已很难满足实际的需求。在基于弱监督的蛋白质交互识别的基础上,提出了一种基于词向量的方法进行特征词选择。该方法用词向量的方式为特征词集合中的每个单词产生一个向量,从而将单词之间相似性的比较转化为单词对应向量之间的相似性比较,进而将单词聚类,再从聚类的结果中选出更能表达蛋白质交互关系的词组成新的特征词集合,以便高效、准确地进行蛋白质交互识别。使用词向量进行聚类可将相似的词归为一类,而不要求词完全相同,使得聚类结果更优。实验结果表明,该方法以五分之一的特征词取得了比未进行特征词选择更优的结果。
彭昀磊牛耘
关键词:聚类特征词
共3页<123>
聚类工具0