伍建军
- 作品数:11 被引量:41H指数:4
- 供职机构:海南大学更多>>
- 相关领域:自动化与计算机技术文化科学语言文字更多>>
- 语义图像信息检索的研究与实现
- 康耀红伍小芹张春元温小斌陈少凡伍建军赵正文郑桢高喆
- 该项目研究了基于内容的图像检索的各种方法,完成了图像视觉特征的抽取,分析对生成图像语义有益的特征,改善获取图像视觉特征的算法,对不同的CBIR算法进行比较验证,以便用于语义图像检索。通过分析用户进行语义图像检索的需求,设...
- 关键词:
- 关键词:信息检索
- 文本分类中特征选择方法的比较和改进被引量:18
- 2007年
- 考察了文档频率DF、互信息MI、CHI统计、CC统计四种不同的特征选择方法,并结合K近邻算法进行分类精度上的比较.为消除MI对低频词的倚重,提出一种DF与MI结合的特征评价函数,并验证了这种组合特征选择方法的有效性.
- 伍建军康耀红
- 关键词:互信息文本分类
- 基于改进的互信息特征选择的文本分类被引量:10
- 2006年
- 使用传统的互信息评估函数进行特征选择方法,得到的分类精度并不高。提出了一种考虑词频作用的互信息评估函数,并采用了K-近邻算法进行文本分类测试,通过分析测试结果,使用改进的互信息评估函数进行特征选择,提高了文本分类的精度。
- 伍建军康耀红
- 关键词:互信息K-近邻法文本分类
- 关于文本分类中特征降维方式的研究
- 文本分类的一个关键点就是如何对高维的特征集进行降维。而特征降维的常用方法就是特征选择、特征抽取等。首先介绍了几种常见的特征选择和特征抽取方法,并对这些特征降维方法的优缺点进行了分析。最后结合 K-近邻分类算法对四种特征选...
- 伍建军康耀红
- 关键词:文本分类特征降维互信息
- 潜在语义索引在文本分类中的应用被引量:4
- 2006年
- 传统的文本分类都是根据文本的外在特征进行的,最常见的就是基于向量空间模型的方法,使用空间向量表示文本,通过相似度比较来确定分类。为了克服向量空间模型中的词条独立性假设,文章提出了一种基于潜在语义索引的文本分类模型,通过对大量的文本集进行统计分析,揭示了词语的上下文使用含义,通过奇异值分解有效地降低了向量空间的维数,消除了同义词、多义词的影响,从而提高了文本分类的精度。
- 伍建军康耀红
- 关键词:潜在语义索引文本分类奇异值分解
- 关于文本分类中特征选择方式的研究
- 文本分类的一个关键点就是如何对高维的特征集进行降维。而特征降维的一般方法就是特征选择。介绍了几种常见的特征选择方法,并结合K-近邻分类算法对这四种特征选择方法进行了分类测试,最后通过测试分析,提出了一些改进的、可行的互信...
- 伍建军康耀红
- 关键词:文本分类K近邻法
- 文献传递
- 多值相关性信息检索理论与技术
- 康耀红张春元伍小芹李太君陈少凡石敏温小斌伍建军
- 该成果来源于海南省自然科学基金资助项目(批准号为60301),针对多值相关性信息检索理论与技术进行了研究,发表学术论文15篇,其中1篇被EI检索,成果主要内容如下:1、建立了面向网上信息的加权标引理论,并成功应用到“基于...
- 关键词:
- 关键词:信息检索搜索引擎
- 关于文本分类中特征降维方式的研究
- 文本分类的一个关键点就是如何对高维的特征集进行降维.而特征降维的常用方法就是特征选择、特征抽取等.首先介绍了几种常见的特征选择和特征抽取方法,并对这些特征降维方法的优缺点进行了分析.最后结合K-近邻分类算法对四种特征选择...
- 伍建军康耀红
- 关键词:文本分类特征降维互信息
- 文献传递
- 文本分类中特征降维方式的研究被引量:5
- 2007年
- 首先介绍了几种常见的特征选择和特征抽取方法,并结合K-近邻分类算法对4种特征选择方法进行了分类测试,同时通过测试分析,提出了一些改进的、可行的互信息评价函数.
- 伍建军康耀红
- 关键词:文本分类特征降维互信息
- 基于K-近邻算法的文本自动分类
- 随着计算机技术的快速发展和Internet的普及与应用,互联网上的电子文档信息急剧增加。面对如此海量的信息,人们迫切需要寻找一条能够快速、准确获得所需信息的途径。而文本自动分类作为信息过滤,信息检索,搜索引擎和数据挖掘等...
- 伍建军
- 关键词:文本自动分类K-近邻算法向量模型特征降维文本预处理
- 文献传递