王美方
- 作品数:4 被引量:32H指数:3
- 供职机构:山东师范大学信息科学与工程学院更多>>
- 发文基金:山东省自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于TFIDF的特征选择方法被引量:26
- 2007年
- 在文本分类系统中,特征选择方法是一种有效的降维方法。在分析了几种常用的特征选择评价函数之后,将权值计算函数应用于特征选择,并基于改进的TFIDF方法提出了一种新的评价函数,它将类别信息引入到特征项中,提取出与类别相关的特征项,弥补了TFIDF的缺陷。实验证明该方法简单可行,有助于提高所选特征子集的有效性。
- 王美方刘培玉朱振方
- 关键词:文本分类评价函数
- 基于CHI与遗传算法的特征选择被引量:3
- 2007年
- 在基于Web文本信息过滤系统中通过特征选择找到的最优特征子集直接影响到分类的速度及精度。针对此问题,提出了综合CHI及遗传算法的特征选择方法。首先针对原始特征集,采用CHI统计法进行初始筛选,去除冗余特征及噪声后,对得到的特征子集再采用遗传算法进行第二次特征选择,从而得出代表问题空间的最优特征子集,实现降维并提高了分类精度。
- 王美方刘培玉
- 关键词:CHI遗传算法
- 基于退火遗传算法的网络信息过滤系统研究被引量:3
- 2009年
- 分析了网络信息过滤一般模型以及现有技术,研究了如何更准确地构建用户模板,提出了一种基于遗传算法的网络信息过滤系统模型,并且引入了遗传扩展操作和Boltzmann群体更新准则来改进遗传算法存在的缺点,同时给出了一种Roocchio反馈模型对用户兴趣模板进行更新和维护。实验结果表明,基于该模型设计的网络信息过滤系统能够有效实现对网络信息过滤。
- 朱振方刘培玉张洪军王美方
- 关键词:信息过滤遗传算法模拟退火
- 信息过滤系统中特征选择算法的研究
- 随着Internet的迅速发展和日益普及,电子文本信息迅速膨胀,如何有效地组织和管理这些信息,并快速、准确、全面地从中找到用户所需要的信息就是当前信息科学技术领域面临的一大挑战。网络信息过滤技术作为处理和组织庞大的网络信...
- 王美方
- 关键词:信息过滤特征选择算法聚类算法
- 文献传递