您的位置: 专家智库 > >

国家重点基础研究发展计划(2013CB329303)

作品数:8 被引量:57H指数:4
相关作者:黄河燕李业刚周新宇毛先领郭宇航更多>>
相关机构:北京理工大学山东理工大学齐鲁工业大学更多>>
发文基金:国家重点基础研究发展计划国家自然科学基金国家教育部博士点基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 8篇中文期刊文章

领域

  • 8篇自动化与计算...

主题

  • 3篇翻译
  • 2篇语义
  • 2篇双语
  • 2篇统计机器
  • 2篇统计机器翻译
  • 2篇向量
  • 2篇机器翻译
  • 2篇翻译模型
  • 1篇短语
  • 1篇断句
  • 1篇信息处理
  • 1篇语料
  • 1篇语义表征
  • 1篇语义分类
  • 1篇社会
  • 1篇统计量
  • 1篇图模型
  • 1篇评测
  • 1篇情感
  • 1篇情感词典

机构

  • 4篇北京理工大学
  • 2篇山东理工大学
  • 1篇商丘师范学院
  • 1篇齐鲁工业大学
  • 1篇北京建筑大学
  • 1篇西北民族大学

作者

  • 3篇黄河燕
  • 2篇李业刚
  • 1篇徐涛
  • 1篇毛先领
  • 1篇于洪志
  • 1篇周洁
  • 1篇孙福振
  • 1篇解红
  • 1篇于潇
  • 1篇加羊吉
  • 1篇樊孝忠
  • 1篇王绍卿
  • 1篇魏楚元
  • 1篇冯冲
  • 1篇鹿文鹏
  • 1篇李艳
  • 1篇柴晓辉
  • 1篇梁丽君
  • 1篇周新宇
  • 1篇吴昊

传媒

  • 2篇自动化学报
  • 2篇中文信息学报
  • 1篇计算机工程
  • 1篇计算机应用研...
  • 1篇信息技术
  • 1篇山东理工大学...

年份

  • 1篇2017
  • 2篇2016
  • 3篇2015
  • 2篇2014
8 条 记 录,以下是 1-8
排序方式:
融合事件信息的中文问答系统问题语义表征被引量:2
2015年
复杂类问题理解是中文问答系统研究的难点,基于组块的问句分析方法将整个问句转化为若干组块,降低了问句分析的难度和复杂性。针对以含有事件(动作)信息的复杂类问题,提出基于语义组块的中文问答系统问题语义表征模型,采用语义组块的思想将问题的语义成分定义为疑问焦点块、问题主题块和问题事件块三个语义组块,对问句中的事件语义信息,建立了问题事件语义结构,将一个问句表征为一个基于语义组块的问题语义表征结构,用于问答系统的问题理解。通过序列标注学习方法实现问题语义表征中语义组块自动标注。实验结果表明:问题语义组块标注效果较好,问题语义表征模型获取了问题的关键语义信息,为语义层面上的问题理解提供基础。
魏楚元湛强樊孝忠毛煜张大奎
情感词典构建综述被引量:22
2016年
文本情感分析是近年来迅速兴起的一个研究课题,具有显著的研究价值和应用价值。情感词典的构建在情感分析任务中发挥着越来越重要的影响力。该文对情感词典构建的研究进展进行了总结。首先重点介绍了情感词典构建的研究现状,将其归纳为四种方法,即基于启发式规则的方法、基于图的方法、基于词对齐模型的方法以及基于表示学习的方法,并对每种方法进行介绍和分析;然后对一些常见的语料库、词典资源以及评测组织进行介绍;最后,对情感词典的构建进行了总结,并对发展趋势进行了展望。
梅莉莉黄河燕周新宇毛先领
关键词:情感分析情感词典评测语料
基于改进卡方统计量的藏文文本表示方法被引量:4
2014年
藏文文本表示是将非结构化的藏文文本转换为计算机能够处理的数据形式,是藏文文本分类、文本聚类等领域特征抽取的前提。传统的藏文文本表示方法较少考虑特征项之间的关联度,容易造成语义损失。为此,结合向量空间模型,提出一种新的藏文文本表示方法。提取文本中词频统计TF-IDF值较高的部分词项作为对比词项,对藏文文本进行断句处理,以每个句子作为一个语境主题,利用卡方统计量计算文本中词项与对比词项的关联程度。实验结果表明,与传统的向量空间模型相比,该方法能更准确地表示藏文文本。
徐涛于洪志加羊吉
关键词:藏文信息处理文本表示向量空间模型
基于Hadoop的专利翻译系统
2015年
为了解决大量专利数据的存储和翻译问题,设计了一种基于Hadoop的专利翻译系统。针对数据存储该系统采用了HDFS和HBase相结合的混合式存储结构,对于翻译过程则采用Hadoop并行翻译模型-MapReduce。通过实验证明,相比于传统的翻译方法该系统具有更好的数据存储和翻译性能。
柴晓辉
关键词:HADOOPMAPREDUCEHBASEHDFS
基于词向量语义分类的微博实体链接方法被引量:11
2016年
微博实体链接是把微博中给定的指称链接到知识库的过程,广泛应用于信息抽取、自动问答等自然语言处理任务(Natural language processing,NLP).由于微博内容简短,传统长文本实体链接的算法并不能很好地用于微博实体链接任务.以往研究大都基于实体指称及其上下文构建模型进行消歧,难以识别具有相似词汇和句法特征的候选实体.本文充分利用指称和候选实体本身所含有的语义信息,提出在词向量层面对任务进行抽象建模,并设计一种基于词向量语义分类的微博实体链接方法.首先通过神经网络训练词向量模板,然后通过实体聚类获得类别标签作为特征,再通过多分类模型预测目标实体的主题类别来完成实体消歧.在NLPCC2014公开评测数据集上的实验结果表明,本文方法的准确率和召回率均高于此前已报道的最佳结果,特别是实体链接准确率有显著提升.
冯冲石戈郭宇航龚静黄河燕
融入双语最大名词组块的树-串统计机器翻译模型
2015年
在统计机器翻译中融入语言学知识具有重要的理论研究和应用价值.在考察了具有丰富的句法和语义信息的双语最大名词组块后,提出和实现了在树-串统计翻译模型中融入双语最大名词短语的统计机器翻译框架.通过在汉-英测试集的实验证明:相比基线模型,采用所述框架的翻译模型的BLEU值提高了1.66%,而且翻译速度也得到了提高.
李业刚解红周洁李艳
关键词:统计机器翻译
融入双语最大名词短语的机器翻译模型被引量:8
2017年
在统计机器翻译中融入有价值的句法层面的语言学知识,对于推动统计机器翻译的发展具有重要的理论意义和应用价值。提出了三种由简到繁的将双语最大名词短语融入到统计翻译模型的策略,整体翻译性能逐步上升。Method-Ⅲ采用分而治之的策略,以硬约束的方式在统计机器翻译中融入最大名词短语,并在双语最大名词短语层面上融合了短语翻译模型和层次短语模型,对翻译系统的改善最显著。所述策略显著提高了短语翻译模型的质量,在复杂长句翻译中,Method-Ⅲ的BLEU值比基于短语的基线翻译模型提高了3.03%。
李业刚梁丽君孙福振王绍卿于潇
关键词:统计机器翻译
基于领域知识的图模型词义消歧方法被引量:10
2014年
对领域知识挖掘利用的充分与否,直接影响到面向特定领域的词义消歧(Word sense disambiguation,WSD)的性能.本文提出一种基于领域知识的图模型词义消歧方法,该方法充分挖掘领域知识,为目标领域收集文本领域关联词作为文本领域知识,为目标歧义词的各个词义获取词义领域标注作为词义领域知识;利用文本领域关联词和句子上下文词构建消歧图,并根据词义领域知识对消歧图进行调整;使用改进的图评分方法对消歧图的各个词义结点的重要度进行评分,选择正确的词义.该方法能有效地将领域知识整合到图模型中,在Koeling数据集上,取得了同类研究的最佳消歧效果.本文亦对多种图模型评分方法做了改进,进行了详细的对比实验研究.
鹿文鹏黄河燕吴昊
关键词:词义消歧领域知识图模型
共1页<1>
聚类工具0