国家自然科学基金(71071161) 作品数:17 被引量:71 H指数:5 相关作者: 刘海峰 刘守生 姚泽清 张学仁 苏展 更多>> 相关机构: 解放军理工大学 电子科技大学 东南大学 更多>> 发文基金: 国家自然科学基金 江苏省自然科学基金 更多>> 相关领域: 自动化与计算机技术 经济管理 理学 军事 更多>>
基于位置及词频信息的优化CHI文本特征选择方法 被引量:5 2015年 特征选择是文本自动分类的核心技术。针对经典的CHI模型不足之处,本文首先从特征项与类别之间的正负相关性角度对特征项进行删减;然后针对类偏斜分类环境下的特征项权重进行调整;进而以特征项的词频数为依据,从特征项在文本中的具体位置、特征项的类内及类间分布等层面再对模型逐步改进,提出了一种优化的CHI特征选择方法。随后的文本分类试验验证了该方法的有效性。 宋阿羚 刘海峰 刘守生城市精明增长评估体系的设计与应用——以敦煌市为例 2017年 城市精明增长理论是城市可持续发展理论的重要延续,对我国城市发展具有重要的战略意义。城市精明增长方案的设计与优化可以使其有限资源产生的效益最大化。本文首先基于城市精明增长准则建立城市精明增长多指标综合评价体系,进而使用熵值法对评估模型中各因素进行赋权,随后对甘肃敦煌市2010~2015年六年的城市发展状况的精明增长指数SMI进行评估。最后,借助灰色关联模型对敦煌市城市总体规划(2013~2030)中2018~2023年的六年城市增长计划进行量化评估并给出相关规划的优化建议。 宋阿羚 刘海峰 刘守生关键词:复合生态系统 熵值法 灰色关联模型 小区开放对改善城市道路通行能力评估分析 2018年 城市封闭式小区是造成道路交通拥堵的主要原因之一。小区开放对优化路网结构、提高道路通行能力、改善城市交通状况的数据评估具有迫切的现实需求。本文首先借助主成分分析及熵值法对三类城市的道路通行能力进行评估;其次对不同规模的城市道路通行能力的差异性及原因进行了分析,为相关城市设计小区开放后优化道路通行能力方案提供参考;最后基于小区开放前后影响交通环境的变化数据,通过引入新的评价因子对BPR函数进行优化,实现小区开放对城市交通状况改善的数据分析。 宋阿羚 王一琁 刘海峰 刘守生关键词:交通拥堵 熵值法 BPR函数 基于逐步回归的区域综合环境治理决策分析——以江苏省为例 2019年 经济发展与环境治理的关系研究具有重要的理论意义与现实需求。本文首先在熵权法赋权的基础上,使用逐步线性回归法构建经济发展、环保投资以及环境污染等关系的评估模型。其次针对涉及经济发展、环保投资以及工业污染的18项指标,以江苏省近21年来相关数据为依据对三者关系进行量化评估,得到对经济发展影响最重要的三项指标的线性关系表达式。最后在对模型的有效性进行验证的基础上,针对经济发展与环境治理的关系提出相应的意见与建议。 曹正洋 刘芃 宋阿羚 刘海峰关键词:经济发展 环境治理 环保投资 基于位置的文本分类样本剪裁及加权方法 被引量:2 2015年 k近邻方法是文本分类中广泛应用的方法,对其性能的优化具有现实需求。使用一种改进的聚类算法进行样本剪裁以提高训练样本的类别表示能力;根据样本的空间位置先后实现了基于类内和类间分布的样本加权;改善了k近邻算法中的大类别、高密度训练样本占优现象。实验结果表明,提出的改进文本加权方法提高了分类器的分类效率。 刘海峰 刘守生 苏展关键词:样本加权 文本聚类 K近邻 文本分类 一种基于类别分布信息的文本特征选择模型 被引量:5 2013年 TF-IDF是一种常用的文本特征选择方法。基于该模型的特征选择思想,以特征项的类内分布、类间分布信息为依据,通过引入类内分布及类间分布权重因子对模型的TF及IDF部分进行加权,提出一种基于类别分布信息的文本特征选择模型。新模型使得TF部分含有类内文本频数信息,同时IDF部分含有特征项的类间频数信息。随后的文本分类试验表明,平均查全率、查准率分别提高6.4%、7.8%,F1值提高约7%,验证了本研究提出的基于类别分布的文本特征选择模型的有效性。 刘海峰 于利军 刘守生关键词:文本分类 TF-IDF 文本分类中基于训练样本空间分布的K近邻改进算法 被引量:9 2013年 KNN算法是文本分类中广泛应用的算法。作为一种基于实例的算法,训练样本的数量和分布位置影响KNN分类器分类性能。合理的样本剪裁以及样本赋权方法可以提高分类器的效率。提出了一种基于样本分布状况的KNN改进模型。首先基于样本位置对训练集进行删减以节约计算开销,然后针对类偏斜现象对分类器的赋权方式进行优化,改善k近邻选择时大类别、高密度训练样本的占优现象。试验结果表明,本文提出的改进KNN文本分类算法提高了KNN的分类效率。 刘海峰 刘守生 姚泽清关键词:文本分类 A MULTI-CRITERIA DECISION MAKING PROCEDURE BASED ON INTERVAL-VALUED INTUITIONISTIC FUZZY BONFERRONI MEANS 被引量:11 2011年 Inspired by the idea of Bonferroni mean,in this paper we develop an aggregation technique called the interval-valued intuitionistic fuzzy Bonferroni mean for aggregating interval-valued intuitionistic fuzzy information.We study its properties and discuss its special cases.For the situations where the input arguments have different importance,we then define a weighted interval-valued intuitionistic fuzzy Bonferroni mean,based on which we give a procedure for multi-criteria decision making under interval-valued intuitionistic fuzzy environments. Zeshui XU关键词:模糊信息 区间值 多准则 模糊环境 复合打击下的火力分配方案评估 被引量:5 2014年 实际火力分配问题中,复合打击广泛存在,相互关联的火力打击行动容易造成火力分配方案评估的失真。通过引进行动集的概念将火力分配方案视作多个火力打击行动的集合,从行动关联和行动子集关联两个角度揭示了复合打击的复杂性,通过对两类关联关系的数学建模,定量地分析了复合打击对火力分配方案评估的影响,并给出了复合打击下火力分配方案评估的方法与过程,最后借助示例说明了本文方法的可行性。 余晓晗 徐泽水 刘守生 白承森关键词:军事运筹 火力分配 文本分类中基于K-means的类偏斜KNN样本剪裁 被引量:6 2012年 KNN算法是经典的文本分类算法.训练样本的数量和类别密度是影响算法性能的主要瓶颈,合理的样本剪裁可以提高分类器效率.文中提出了一种基于聚类的改进KNN分类模型.首先对训练集进行聚类,基于测试样本与簇之间的相对位置对训练集进行合理裁剪以节约计算开销;然后基于簇内样本分布进行样本赋权,改善大类别样本的密度占优现象.实验结果表明,本文提出的样本剪裁方法提高了KNN算法的分类性能. 刘海峰 姚泽清 苏展 张学仁关键词:聚类