您的位置: 专家智库 > >

陈袆

作品数:1 被引量:22H指数:1
供职机构:复旦大学计算机科学技术学院更多>>
发文基金:福建省教育厅科技项目国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇文本分类
  • 1篇关联规则
  • 1篇词频

机构

  • 1篇复旦大学
  • 1篇福州大学

作者

  • 1篇胡运发
  • 1篇王雷
  • 1篇陈晓云
  • 1篇李荣陆
  • 1篇陈袆

传媒

  • 1篇软件学报

年份

  • 1篇2006
1 条 记 录,以下是 1-1
排序方式:
基于分类规则树的频繁模式文本分类被引量:22
2006年
基于频繁模式的关联分类是近年来出现的一种分类方法,该方法利用各类别频繁出现的模式构造分类规则,并对新文本进行分类.但现有关联分类方法应用于文本分类时存在两方面不足:一方面,用以构造分类规则的频繁模式仅考虑特征词在文本中出现与否,从而忽视了出现频度;另一方面,当产生的规则数量较多时,为提高分类效率需要进行规则修剪,修剪后的分类准确性明显降低.为此,提出了基于分类规则树的带词频的频繁模式文本分类方法.研究结果表明,词频的引入可以提高关联分类的准确率;而采用分类规则树可使分类时间明显加快又确保不降低分类质量.这两方面的措施弥补了现有关联分类应用于文本分类的不足.与3种典型文本分类方法比较后发现,在低维特征空间中,关联分类的性能优于Bayes,kNN(knearestneighbor)和SVM(supportvectormachines),因此是一种很有应用前景的文本分类方法.
陈晓云陈袆王雷李荣陆胡运发
关键词:文本分类词频关联规则
共1页<1>
聚类工具0