您的位置: 专家智库 > >

国家自然科学基金(60675034)

作品数:6 被引量:188H指数:5
相关作者:刘挺李生张宇秦兵刘鸿宇更多>>
相关机构:哈尔滨工业大学西北师范大学更多>>
发文基金:国家自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 6篇期刊文章
  • 4篇会议论文

领域

  • 9篇自动化与计算...
  • 1篇语言文字

主题

  • 5篇中文
  • 4篇信息处理
  • 4篇中文信息
  • 4篇中文信息处理
  • 4篇抽取
  • 3篇计算机
  • 3篇计算机应用
  • 2篇对象抽取
  • 2篇评价对象抽取
  • 2篇情感分析
  • 2篇句法
  • 2篇句法分析
  • 1篇隐式
  • 1篇隐式反馈
  • 1篇映射
  • 1篇语言
  • 1篇语言模型
  • 1篇语义
  • 1篇语义分析
  • 1篇语义角色

机构

  • 10篇哈尔滨工业大...
  • 1篇西北师范大学

作者

  • 10篇刘挺
  • 4篇秦兵
  • 4篇李生
  • 3篇赵妍妍
  • 3篇车万翔
  • 3篇张宇
  • 2篇张志昌
  • 2篇刘鸿宇
  • 1篇伍大勇
  • 1篇张宇
  • 1篇刘怀军
  • 1篇郭宇航
  • 1篇陈毅恒
  • 1篇宋巍

传媒

  • 4篇中文信息学报
  • 1篇计算机研究与...
  • 1篇电子学报
  • 1篇第十届全国计...

年份

  • 3篇2010
  • 3篇2009
  • 1篇2008
  • 3篇2007
6 条 记 录,以下是 1-10
排序方式:
基于检索历史上下文的个性化查询重构技术研究被引量:13
2010年
基于检索历史隐式地学习用户偏好是个性化检索研究的热点,而根据用户检索历史重构新的查询输入是其中主要的研究内容。已有的研究在利用检索历史进行查询重构时,通常不区分检索历史中的内容是否与当前查询相关,而是将全部检索历史视为整体,因而使重构后的查询含有较多噪声。该文基于相关词语在上下文中大量共现的特征,将用户历史检索结果的网页摘要作为上下文语境,结合用户点击,选择检索历史中与当前查询共现程度最高的词语重构查询模型。对初始检索结果重排序的实验表明,该方法可以有效地选择相关词语,减少噪声。用p@5和NDCG两种指标评价,比最好的基准系统分别相对提高12.8%和7.2%,比初始排序结果相对提高26.0%和11.4%。
宋巍张宇刘挺李生
关键词:计算机应用中文信息处理个性化检索隐式反馈
基于潜在语义索引和自组织映射网的检索结果聚类方法被引量:6
2009年
随着互联网的不断发展和数据量的不断增加,搜索引擎的作用日益明显,用户更多地依靠搜索引擎来查找需要的信息.利用潜在语义索引(LSI)理论和自组织映射神经网络(SOM)理论,提出了一种文本聚类的新方法——LSOM.该方法应用SOM网络来实现检索结果文本聚类,不必预先给定类别个数,具有聚类灵活和精度高等特点;同时,该方法应用LSI理论来建立向量空间模型,在词条的权重中引入了语义关系,对于高维的文本特征向量,消减原词条矩阵中包含的噪声,提高聚类速度.LSOM使用一种新的类别标签提取方法,并将提取的标签用于解决SOM基本类划分问题,算法在类别标签和聚类效果评价指标上都比已有的算法有所提高.
陈毅恒秦兵刘挺王平李生
关键词:检索结果聚类潜在语义索引标签
开放域问答技术研究进展被引量:18
2009年
问答技术是信息检索和自然语言理解中的研究热点.本文对开放域问答技术在近年来的研究进展进行了总结.针对不同类型的问题,比较了问答系统中问题分析、文档和句段检索、答案抽取各个部分不同实现方法的特点,讨论了这些技术中存在的不足.最后,对问答技术未来的研究趋势进行了分析与展望.
张志昌张宇刘挺李生
关键词:答案抽取
中文交互式问答用户问题相关检测研究被引量:3
2010年
交互式问答是具备处理系列相关问题以及与用户进行对话式交互的问答技术,是近年来国际上问答技术研究的一个热门方向,但是目前在中文问答领域几乎没有开展相关的研究。实现交互式问答系统首先要判别用户系列问题之间的相关性。该文探讨了提取问题中不同特征对中文交互式问答问题相关检测的作用,并且根据识别出的有效特征采用基于二元分类方法分别对翻译成中文的TREC QA问题集语料和真实的交互式问答语料进行问题相关检测实验,实验结果显示该文的方法获得了较好的问题相关检测效果。
伍大勇张宇刘挺
关键词:计算机应用中文信息处理
评价对象抽取及其倾向性分析
情感分析近年来已经成为自然语言处理领域的热点问题,本文对情感分析中的两项关键技术——评价对象抽取和倾向性判断进行了深入研究。在评价对象抽取阶段,首先使用句法分析结果获取候选评价对象,继而结合基于网络挖掘的PMI算法和名词...
刘鸿宇赵妍妍秦兵刘挺
关键词:情感分析句法分析
文献传递
中文语义角色标注的特征工程被引量:47
2007年
基于统计机器学习的语义角色标注在自然语言处理领域越来越受到重视,丰富多样的特征直接决定语义角色标注系统的性能。本文针对中文的特点,在英文语义角色标注特征的基础上,提出了一些更有效的新特征和组合特征:例如,句法成分后一个词、谓语动词和短语类型的组合、谓语动词类别信息和路径的组合等,并在Chinese Proposition Bank(CPB)语料数据上,使用最大熵分类器进行了实验,系统F-Score由89.76%增加到91.31%。结果表明,这些新特征和组合特征显著提高了系统的性能。因此,目前进行语义角色标注应集中精力寻找丰富有效的特征。
刘怀军车万翔刘挺
关键词:中文信息处理语义分析语义角色标注最大熵分类器
评价对象抽取及其倾向性分析被引量:101
2010年
情感分析近年来已经成为自然语言处理领域的热点问题,该文对情感分析中的两项关键技术——评价对象抽取和倾向性判断进行了深入研究。在评价对象抽取阶段,首先使用句法分析结果获取候选评价对象,继而结合基于网络挖掘的PMI算法和名词剪枝算法对候选评价对象进行筛选。在倾向性判断阶段,通过分析情感句句型,归纳相应的分析规则,使用无指导的方法完成评价对象在情感句中的倾向性判断。该系统参加了COAE2008任务三的评测,取得了较好成绩。
刘鸿宇赵妍妍秦兵刘挺
关键词:计算机应用中文信息处理情感分析句法分析
基于语言模型验证的词义消歧语料获取
作为一种稀缺资源,人工标注语料的匮乏限制了有指导词义消歧系统的大规模应用.有人提出了利用目标词的单义同义词在生语料中自动获取词义消歧语料的方法,然而,在某些上下文当中,用目标词替换这些单义的同义词并不合适,从而带来噪声....
郭宇航车万翔刘挺
关键词:词义消歧噪声语言模型
文献传递
基于浅层语义树kernel的阅读理解答案句抽取
本文提出一种利用浅层语义信息的英文阅读理解答案句抽取方法,首先将问题和所有候选句的语义角色标注结果表示成树状结构,用树 kernel 的方法计算问题和每个候选句之间的语义结构相似度,将该相似度值和词袋方法获得的词匹配数融...
张志昌张宇刘挺李生
文献传递
中文事件抽取技术研究
事件抽取是信息抽取领域一个重要的研究方向,本文对事件抽取的两项关键技术——事件类别识别以及事件元素识别进行了深入研究。在事件类别识别阶段,本文采用了一种基于触发词扩展和二元分类相结合的方法;在事件元素识别阶段,本文采用了...
赵妍妍秦兵车万翔刘挺
关键词:事件抽取
文献传递
共1页<1>
聚类工具0