国家教育部博士点基金(20110043110011)
- 作品数:4 被引量:10H指数:2
- 相关作者:孙铁利孙红光伊力亚尔胡西旦房超更多>>
- 相关机构:东北师范大学伊犁师范学院北京理工大学更多>>
- 发文基金:国家教育部博士点基金国家自然科学基金吉林省科技发展计划基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种新的本体的概念语义相似度计算方法被引量:1
- 2015年
- 提出了一种新的语义相似度计算方法。该算法结合了被评估概念的高度、路径长度和公共细化度(specificity);改进了基于路径的语义相似度算法,利用本体结构,引入基于信息量算法的思想,使得新算法能够获取更多的语义信息,同时又不需要对于文本数据进行预处理;考虑本体中簇的粒度对本体的相似度计算有一定影响,在公式中添加概念在本体中的高度信息,达到低层次的概念间共享的信息要比高层次的概念间共享的信息更多。为了评估所提出的新方法,在实验中,用标准的生物医学系统命名法-临床术语(systematized nomenclature of medicine-clinical terms,SNOMED CT)作为输入本体,用已标注好的概念对集合作为数据集。实验结果表明,所提出的方法不仅保留了基于路径算法的简洁性,还优于现有语义相似度算法,证明了所提出方法的有效性。
- 孙铁利邢元元关煜陈斯娅杨凤芹孙红光
- 关键词:语义相似度
- 一种基于改进KNN的哈萨克语文本分类被引量:4
- 2014年
- 将文本分类理论应用于哈萨克语中,给出了哈萨克语文本预处理过程.介绍一种改进的KNN算法,并结合自己构建的哈萨克语料集实现基于改进KNN算法的哈萨克语的文本分类.仿真实验数据表明,该方法在哈萨克语的文本分类上获得了较好的效果.
- 古丽娜孜孙铁利胡西旦伊力亚尔库瓦特拜克
- 关键词:词干提取向量空间模型KNN
- 一种基于SVM-修正KNN 算法的哈萨克语文本分类被引量:2
- 2014年
- 为了实现哈萨克语文本分类,根据哈萨克语语法规则,给出了哈萨克语文本词干的提取方法;结合DFR特征选择方法和VSM文本表示模型实现哈萨克语文本的预处理,提出了一种SVM和修正KNN协同的文本分类算法,分别在自行构建的语料集和整理的《新疆日报》哈萨克语数据集上进行大量文本分类仿真实验.结果表明,该方法在哈萨克语文本分类上具有良好的分类性能,并比SVM,KNN的测试性能优越.
- 古丽娜孜.艾力木江孙铁利乎西旦特列克别克
- 关键词:词干提取DFRVSM
- 一种自适应基于暗通道先验的去雾方法被引量:4
- 2012年
- 基于暗通道先验去雾方法,提出一种改进的自适应基于暗通道先验去雾方法,并使用均方误差对已有雾模型数据库中多组数据进行误差分析.实验结果表明,该方法对光线不足或天空等背景的图像实验效果优于已有方法,并且恢复的图像更接近真实图像.
- 孙红光房超张慧杰刘丽红王建中
- 关键词:去雾