孙海虹
- 作品数:2 被引量:0H指数:0
- 供职机构:哈尔滨理工大学计算机科学与技术学院计算机系更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于模糊粗糙集的Web文本分类研究
- 随着计算机与网络技术的快速发展,网络已成为人们存储和获取信息的主要媒介,用户在享受便捷的同时,也饱受网络信息资源大、获取信息难的困扰。文本分类技术可以快速定位有用信息,帮助用户快速高效地获取知识。模糊粗糙集是一种处理不确...
- 孙海虹
- 关键词:模糊粗糙集WEB文本分类属性约简
- 文献传递
- 基于模糊粗糙集的Web文本分类
- 2010年
- 网络信息的多样性和多变性给信息的管理和过滤带来极大困难,为加快网络信息的分类速度和分类精度,提出了一种基于模糊粗糙集的Web文本分类方法。采用机器学习的方法:在训练阶段,首先对Web文本信息预处理,用向量空间模型表示文本,生成初始特征属性空间,并进行权值计算;然后用模糊粗糙集算法来进行信息过滤,用基于模糊粗糙集的属性约简算法生成分类规则;最后利用知识库进行文档分类。在测试阶段,对未经预处理的文本直接进行关键属性匹配,经模糊粗糙因子加权后,用空间距离法分类。通过试验比较,该方法具有较好的分类效果。
- 孙海虹丁华福
- 关键词:模糊粗糙集WEB文本分类属性约简