您的位置: 专家智库 > >

韩艳铧

作品数:3 被引量:23H指数:3
供职机构:北京信息科技大学中文信息处理研究中心更多>>
发文基金:北京市教委科技发展计划北京市自然科学基金国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇中文期刊文章

领域

  • 3篇自动化与计算...

主题

  • 1篇短语
  • 1篇短语词典
  • 1篇引擎
  • 1篇于字
  • 1篇日志
  • 1篇搜索
  • 1篇搜索引擎
  • 1篇随机场
  • 1篇索引
  • 1篇条件随机场
  • 1篇同现
  • 1篇自动抽取
  • 1篇关键词自动抽...
  • 1篇N1+N2
  • 1篇查询
  • 1篇查询优化
  • 1篇抽取
  • 1篇词典

机构

  • 3篇北京信息科技...
  • 1篇北京拓尔思信...

作者

  • 3篇吕学强
  • 3篇韩艳铧
  • 1篇都云程
  • 1篇王锴
  • 1篇施水才
  • 1篇王涛
  • 1篇周伟
  • 1篇倪廓阔

传媒

  • 1篇计算机应用与...
  • 1篇计算机工程与...
  • 1篇北京信息科技...

年份

  • 1篇2013
  • 1篇2012
  • 1篇2011
3 条 记 录,以下是 1-3
排序方式:
基于条件随机场的领域术语识别研究被引量:14
2013年
领域术语是各个领域的核心词汇,在研究了大量领域文献的基础上,提出了一种识别领域术语的方法。该方法以现有成熟工具为依托,使用条件随机场模型统计领域术语的词性组合概率。在选定特征集后,通过调整特征和窗口的组合,制定一个最优特征模板,同时通过10倍交叉验证法确定模型训练参数。实验结果表明,通过条件随机场模型分析领域术语的词性组合概率能够有效地识别领域术语。
施水才王锴韩艳铧吕学强
关键词:条件随机场
基于字同现频率的关键词自动抽取被引量:4
2011年
为提高关键词自动抽取的准确率,提出了基于字同现频率的关键词自动抽取算法。根据词的位置和文本长度改进TF/IDF算法,由字同现频率计算词的信息量,运用特征加权计算词的权重,选取权重大的词作为关键词。给出了关键词自动抽取的过程,设计了关键词抽取的对比实验,验证该算法的有效性。实验结果表明该算法在准确率和召回率上具有优势。
都云程周伟韩艳铧吕学强
关键词:关键词自动抽取
搜索引擎中“N1+N2”型短语查询优化研究被引量:5
2012年
"N1+N2"作为现代汉语中常见的短语形式,亦广泛存在于搜索引擎检索用语中。以日志短语词典为基础,根据搜索日志查询串的语言特点,对包含"N1+N2"型短语的查询串进行改写,其中包括空格分割、引号加注和焦点强调方法,并对查询串粗略分类。实验结果显示:在引号加注的作用下MPA由0.362提高到0.441;导航类查询MRR值从0.64提升到0.719,信息事务类查询MRR值从0.25增加到0.344。从而验证了短语特征能够指导查询结果优化,进而提升搜索引擎性能。
倪廓阔吕学强韩艳铧王涛
关键词:搜索引擎查询优化
共1页<1>
聚类工具0