米晓芳
- 作品数:5 被引量:4H指数:2
- 供职机构:烟台大学计算机学院更多>>
- 发文基金:山东省自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于潜在语义差异的医学网页聚类被引量:2
- 2008年
- 采用潜在语义索引的全局模型和局部模型表示医学网页时,模糊聚类结果的类间包含度很大。该文提出一种新的潜在语义差异模型,将医学网页中的文本抽取出来并分别采用全局模型、局部模型和差异模型进行表示,利用FCM算法进行聚类并计算类间包含度。实验发现,对给定的5类医学网页进行聚类时,采用差异模型时的类间包含度平均约为全局模型的85%、局部模型的80%。
- 米晓芳秦洋王立宏宋宜斌
- 关键词:潜在语义索引文本挖掘FCM聚类包含度
- 基于潜在语义差异的医学网页分类
- 通过分析潜在语义索引的各种模型提出一种新的潜在语义差异模型。将医学网页中的文本抽取出来并分别采用全局模型、局部模型和差异模型进行表示,利用SVM算法进行分类并计算分类正确率和F<,1>指标。实验发现:在差异模型表示下,分...
- 米晓芳秦洋王立宏宋宜斌
- 关键词:潜在语义索引文本分类SVM算法
- 文献传递
- 基于潜在语义差异的医学网页分类
- 通过分析潜在语义索引的各种模型提出一种新的潜在语义差异模型。将医学网页中的文本抽取出来并分别采用全局模型、局部模型和差异模型进行表示,利用 SVM 算法进行分类并计算分类正确率和 F指标。实验发现:在差异模型表示下,分类...
- 米晓芳秦洋王立宏宋宜斌
- 关键词:潜在语义索引文本分类
- 文献传递
- 一种潜在语义索引差异模型被引量:2
- 2008年
- 通过对全局模型和局部模型的分析,提出一种新的潜在语义索引差异模型,能将类别信息反应在词项中.以医学网页为实验对象,将网页中的文本抽取出来并分别用全局模型和差异模型表示,采用SVD和SLSI降维,利用SVM算法进行分类并计算分类正确率和F1指标.实验发现:采用差异模型表示时,2种降维技术下分类正确率和F1指标较全局模型都有明显提高;同时采用差异模型和SLSI算法并不能对分类结果有更大改善.
- 米晓芳王立宏宋宜斌
- 关键词:潜在语义索引文本分类SVM算法
- 一种潜在语义索引差异模型及其应用
- 目前,文本自动分类是信息检索领域中的研究热点之一,传统的文本分类方法是采用词作为特征构建特征向量,但是文本中词的数量非常大,导致了特征向量空间的维数非常高,因此需要对文本进行降维。目前降维技术主要有两种:特征选择和特征抽...
- 米晓芳
- 关键词:文本分类特征抽取
- 文献传递