您的位置: 专家智库 > >

国家高技术研究发展计划(2006AA01Z148)

作品数:7 被引量:52H指数:4
相关作者:蔡东风季铎张桂平郑伟周俏丽更多>>
相关机构:沈阳航空工业学院更多>>
发文基金:国家高技术研究发展计划教育部科学技术研究重点项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 7篇期刊文章
  • 6篇会议论文

领域

  • 11篇自动化与计算...
  • 2篇语言文字
  • 1篇文化科学

主题

  • 3篇信息处理
  • 3篇中文
  • 3篇中文信息
  • 3篇中文信息处理
  • 3篇文本聚类
  • 3篇相似度
  • 3篇聚类
  • 3篇计算机
  • 3篇计算机应用
  • 2篇优化技术
  • 2篇语义索引
  • 2篇随机场
  • 2篇索引
  • 2篇条件随机场
  • 2篇奇异值
  • 2篇奇异值分解
  • 2篇潜在语义
  • 2篇潜在语义索引
  • 2篇人工智能
  • 2篇机器翻译

机构

  • 13篇沈阳航空工业...

作者

  • 12篇蔡东风
  • 10篇季铎
  • 8篇张桂平
  • 3篇郑伟
  • 2篇王智超
  • 2篇代翠
  • 2篇杨洁
  • 2篇宁伟
  • 2篇苗雪雷
  • 1篇胡永华
  • 1篇赵环宇
  • 1篇宋彦
  • 1篇周俏丽
  • 1篇刘磊
  • 1篇王爽

传媒

  • 5篇中文信息学报
  • 1篇广西师范大学...
  • 1篇沈阳航空工业...
  • 1篇第四届全国信...
  • 1篇第九届全国计...

年份

  • 2篇2009
  • 9篇2008
  • 2篇2007
7 条 记 录,以下是 1-10
排序方式:
潜在语义索引中特征优化技术的研究被引量:8
2009年
潜在语义索引被广泛应用于信息检索、文本分类、自动问答等领域中。潜在语义索引是一种降维方法,它把共现特征映射到同一维空间上,而非共现特征映射到不同的空间上。在潜在语义索引的语义空间中,共现特征通过文档内部以及文档之间的特征传递关系获得。该文认为这种特征传递关系会引入一些不存在的共现特征,从而降低潜在语义索引的性能,应该对这种特征传递关系进行一些选择,削除不存在的共现特征信息。该文采用文档频率对文档集合进行特征选择,用Complete—Link聚类算法在两个公开语料上进行三个实验,实验结果显示,保留文档频度的10%~15%时,其F1值分别提高了6.5770%,1.9928%和3.3614%。
季铎郑伟蔡东风
关键词:计算机应用中文信息处理潜在语义索引奇异值分解
潜在语义索引中特征优化技术的研究
潜在语义索引被广泛应用于信息检索、文本分类、自动问答系统等领域中。潜在语义索引是一种降维方法,它把共现特征映射到同一维空间上,而非共现特征映射到不同的空间上。在潜在语义索引的语义空间中,共现特征通过文档内部以及文档之间的...
郑伟季铎蔡东风
关键词:潜在语义索引奇异值分解
文献传递
基于语义预测的双语术语相似度计算
双语术语相似度计算在跨语言信息检索等领域有重要的应用。目前双语术语相似度计算主要有基于统计和语言学两类方法,其中,本文针对语言学中基于词典的术语相似度计算效果受词典覆盖面影响较大的缺点,提出基于词典的语义预测扩展相似度算...
刘磊张桂平蔡东风季铎
关键词:动态规划
文献传递
基于SVM的无参考译文的译文质量评测
译文质量评测是译文质量的保证,是机器翻译系统性能最有效的评价。与传统的通过计算候选译文和参考译文的相似度的评测方法不同,本文提出一种基于SVM的无参考译文的质量自动评测方法。首先对译文中的句子按照是否存在错误以及错误类型...
宁伟苗雪雷胡永华季铎张桂平蔡东风
关键词:支持向量机句法特征
文献传递
基于TextRank的多文档关键词抽取技术
本文提出一种基于TextRaak的多文档关键词抽取方法,该方法利用ATFPDF方法计算文档集中的词语权重,抽取权重较大的实词为候选关键词,并根据候选关键诃之问的语义相似关系建立TextRank模型,递归计算至收敛,最后生...
杨洁季铎蔡东风代翠
关键词:多文档语义相似度
文献传递
统计和规则相结合的汉语最长名词短语自动识别被引量:17
2008年
在分析汉语最长名词短语特点的基础上,提出了一种统计和规则相结合的汉语最长名词短语自动识别方法:通过实验词及词性的不同组合选择特征集合,基于该特征训练得到条件随机场(CRF)识别模型;分析错误识别结果,结合最长名词短语的边界信息和内部结构信息构建规则库对识别结果进行后处理,弥补了机器学习模型获取知识不够全面的不足。实验结果表明,用统计和规则相结合的方法识别最长名词短语是有效的,系统开放测试结果F值达到了90.2%。
代翠周俏丽蔡东风杨洁
关键词:计算机应用中文信息处理条件随机场
基于条件随机场的冠词选择研究被引量:1
2008年
冠词选择需要综合考虑语言知识、语义知识以及世界知识,是汉英翻译中的一个难点。针对传统的基于规则和机器学习的方法,只考虑名词短语前冠词选择的问题,该文将冠词看作一种标记,将该问题形式化地描述为一个序列标注任务,提出一种基于条件随机场的解决策略,选取特征时充分利用词、词性等多层次资源,并引入前后词的互信息。实验采用包含91 106个冠词的专利摘要做测试语料,F值达到80%。
宁伟蔡东风张桂平季铎苗雪雷
关键词:人工智能机器翻译条件随机场互信息
文本聚类中基于知网的特征抽取方法
本文将语义分析引入到文本聚类的任务中,提出了一种基于知网的特征抽取方法。针对词语的一词多义的现象,从全文的角度考察词的语义,结合相关概念场,将词义排歧转化为对相关概念场中的词在全文出现频率的计算。实验证明,经过词义消歧后...
王智超季铎蔡东风张桂平
关键词:知网特征抽取文本聚类
文献传递
基于文本最小相似度的中心选取方法被引量:3
2008年
基于划分的聚类算法是一种局部最优算法。聚类初始中心的选择对该聚类算法的收敛速度和聚类的性能都有很大的影响。初始中心点应该选择来自不同的类并且初始中心点文本之间的相似度应尽量小,为此提出了一种新的基于最小相似度的中心选取方法,该方法选择相似度最小的两个样本分别作为初始的两个中心,然后依次选择到已知中心相似度最小的样本作为其他类的中心。实验表明该方法能够选出来自不同类的样本作为聚类的初始中心,同其他初始中心选择方法比较,聚类算法的性能有明显提高。
郑伟季铎蔡东风王爽
关键词:文本聚类
基于知识管理和智能控制的协同翻译平台——知识管理和机器翻译的融合被引量:10
2008年
在对机器翻译发展艰难历程总结和反思的基础上,提出了以用户模型为核心的知识管理与机器翻译技术融合的新思想。2008年7月该成果通过了中国中文信息学会在京组织的鉴定,鉴定委员会一致认为:"研制单位基于其所承担的国家863课题机器翻译和知识管理技术的融合研发的基于知识管理和智能控制的协同翻译平台已圆满完成。该项研究在利用知识管理技术实现人机双向协同翻译方面达到国际领先水平。"本文对平台研制的思想与方法、设计与实现、分析与应用、历程与展望进行了阐述。
张桂平蔡东风
关键词:人工智能机器翻译知识管理用户模型
共2页<12>
聚类工具0