您的位置: 专家智库 > >

王成

作品数:1 被引量:1H指数:1
供职机构:北京信息科技大学中文信息处理研究中心更多>>
发文基金:北京市自然科学基金国家自然科学基金国家科技重大专项更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇信息熵
  • 1篇语言处理
  • 1篇知识获取
  • 1篇自然语言
  • 1篇自然语言处理

机构

  • 1篇北京信息科技...

作者

  • 1篇吕学强
  • 1篇王涛
  • 1篇王弘蔚
  • 1篇王成

传媒

  • 1篇北京信息科技...

年份

  • 1篇2011
1 条 记 录,以下是 1-1
排序方式:
基于信息熵与词语活跃度的领域词抽取被引量:1
2011年
提出了一种基于信息墒和词语活跃度的领域词抽取方法,通过对语料进行预处理,提取出候选领域词,计算所有候选领域词的正规化类间分布(NCD)和正规化类内分布(NDD),设置阈值对候选领域词过滤,最后分析了双字候选领域词中包含的常见噪音词语,使用词语活跃度对候选领域词中的双字词语进行过滤,该方法综合考虑了领域词在类别中的概率分布和领域词的内部特征。实验结果表明,该方法在领域词的识别上具有较好的准确率和召回率。
王成吕学强王弘蔚王涛
关键词:信息熵知识获取自然语言处理
共1页<1>
聚类工具0