江苏省自然科学基金(BK2012511)
- 作品数:22 被引量:102H指数:6
- 相关作者:刘海峰刘守生岳振军邱继远荣传振更多>>
- 相关机构:解放军理工大学东南大学国防科技大学更多>>
- 发文基金:江苏省自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术交通运输工程文化科学经济管理更多>>
- 城市精明增长评估体系的设计与应用——以敦煌市为例
- 2017年
- 城市精明增长理论是城市可持续发展理论的重要延续,对我国城市发展具有重要的战略意义。城市精明增长方案的设计与优化可以使其有限资源产生的效益最大化。本文首先基于城市精明增长准则建立城市精明增长多指标综合评价体系,进而使用熵值法对评估模型中各因素进行赋权,随后对甘肃敦煌市2010~2015年六年的城市发展状况的精明增长指数SMI进行评估。最后,借助灰色关联模型对敦煌市城市总体规划(2013~2030)中2018~2023年的六年城市增长计划进行量化评估并给出相关规划的优化建议。
- 宋阿羚刘海峰刘守生
- 关键词:复合生态系统熵值法灰色关联模型
- 小区开放对改善城市道路通行能力评估分析
- 2018年
- 城市封闭式小区是造成道路交通拥堵的主要原因之一。小区开放对优化路网结构、提高道路通行能力、改善城市交通状况的数据评估具有迫切的现实需求。本文首先借助主成分分析及熵值法对三类城市的道路通行能力进行评估;其次对不同规模的城市道路通行能力的差异性及原因进行了分析,为相关城市设计小区开放后优化道路通行能力方案提供参考;最后基于小区开放前后影响交通环境的变化数据,通过引入新的评价因子对BPR函数进行优化,实现小区开放对城市交通状况改善的数据分析。
- 宋阿羚王一琁刘海峰刘守生
- 关键词:交通拥堵熵值法BPR函数
- 基于逐步回归的区域综合环境治理决策分析——以江苏省为例
- 2019年
- 经济发展与环境治理的关系研究具有重要的理论意义与现实需求。本文首先在熵权法赋权的基础上,使用逐步线性回归法构建经济发展、环保投资以及环境污染等关系的评估模型。其次针对涉及经济发展、环保投资以及工业污染的18项指标,以江苏省近21年来相关数据为依据对三者关系进行量化评估,得到对经济发展影响最重要的三项指标的线性关系表达式。最后在对模型的有效性进行验证的基础上,针对经济发展与环境治理的关系提出相应的意见与建议。
- 曹正洋刘芃宋阿羚刘海峰
- 关键词:经济发展环境治理环保投资
- 基于词频分布信息的优化IG特征选择方法被引量:9
- 2017年
- 文本特征选择是文本分类的核心技术。针对信息增益模型的不足之处,以特征项的频数在文本中不同层面的分布为依据,分别从特征项基于文本的类内分布、基于词频的类内分布以及词频的类间分布等角度对IG模型逐步进行改进,提出了一种基于词频分布信息的优化IG特征选择方法。随后的文本分类实验验证了提出的优化IG模型的有效性。
- 刘海峰刘守生宋阿羚
- 关键词:信息增益文本分类
- 基于位置的文本分类样本剪裁及加权方法被引量:2
- 2015年
- k近邻方法是文本分类中广泛应用的方法,对其性能的优化具有现实需求。使用一种改进的聚类算法进行样本剪裁以提高训练样本的类别表示能力;根据样本的空间位置先后实现了基于类内和类间分布的样本加权;改善了k近邻算法中的大类别、高密度训练样本占优现象。实验结果表明,提出的改进文本加权方法提高了分类器的分类效率。
- 刘海峰刘守生苏展
- 关键词:样本加权文本聚类K近邻文本分类
- 基于词频的优化互信息文本特征选择方法被引量:13
- 2014年
- 互信息(MI)是一种常用的文本特征选择方法,经典MI方法未考虑同一个特征项在不同类别内频数的差异性,也未考虑同一个特征在同一类别内的不同文本之间分布上的差异性。针对上述不足,以特征项的频数为依据,分别从特征项的类内分布、类间分布上的差异以及类内不同文本之间分布上的差异等角度,通过引入特征项的类内频数因子、类内位置分布因子以及类间分布因子,提出一种改进的MI文本特征选择方法,使得特征项的频数信息在MI模型中得到有效利用,合理改善互信息模型在文本特征选择方面的不足。文本分类实验结果表明,改进MI文本特征选择方法的平均准确率、召回率分别提高约5.2%及4.6%,平均综合评价指标值提高约4.9%,有效提高了模型的文本分类效率。
- 刘海峰姚泽清苏展
- 关键词:文本分类互信息特征降维
- 一种基于类别分布信息的文本特征选择模型被引量:5
- 2013年
- TF-IDF是一种常用的文本特征选择方法。基于该模型的特征选择思想,以特征项的类内分布、类间分布信息为依据,通过引入类内分布及类间分布权重因子对模型的TF及IDF部分进行加权,提出一种基于类别分布信息的文本特征选择模型。新模型使得TF部分含有类内文本频数信息,同时IDF部分含有特征项的类间频数信息。随后的文本分类试验表明,平均查全率、查准率分别提高6.4%、7.8%,F1值提高约7%,验证了本研究提出的基于类别分布的文本特征选择模型的有效性。
- 刘海峰于利军刘守生
- 关键词:文本分类TF-IDF
- 聚类数据挖掘可视化模型方法与技术被引量:8
- 2015年
- 面向通用数据资源,研究聚类数据可视化方法与技术,旨在探索有效的数据处理方法,满足信息领域对高维数据处理的要求。通过对高维数据进行降维处理和可视化映射实现,建立K均值算法的聚类数据挖掘可视化系统模型,实现中间聚簇结果、聚类中心、收敛准则函数值三类要素的可视化。利用加利福利亚大学欧文分校(UCI)数据库中的Iris数据集、Wine数据集、Seeds数据集对可视化系统模型方法进行测试。结果表明,该模型实现了对数据集的有效聚类,能够将中间聚类、聚类中心、收敛准则函数值进行实时有效的可视化表达,达到了预期效果。
- 谢庆华张宁蓉宋以胜王海波岳振军
- 关键词:可视化平行坐标法K均值算法
- 基于位置及词频信息的优化CHI文本特征选择方法被引量:6
- 2015年
- 特征选择是文本自动分类的核心技术。针对经典的CHI模型不足之处,本文首先从特征项与类别之间的正负相关性角度对特征项进行删减;然后针对类偏斜分类环境下的特征项权重进行调整;进而以特征项的词频数为依据,从特征项在文本中的具体位置、特征项的类内及类间分布等层面再对模型逐步改进,提出了一种优化的CHI特征选择方法。随后的文本分类试验验证了该方法的有效性。
- 宋阿羚刘海峰刘守生
- 基于改进的带监督流形学习算法的通信电台识别被引量:2
- 2013年
- 设计了一种电台主域积分双谱(PIB)特征参数提取方法,利用双谱特征的对称性,简化计算,提高计算效率。针对PIB特征参数冗余仍然较大,导致分类器复杂、识别效率低的问题,提出了一种改进的带监督局部线性嵌入(LLE)流形学习方法,利用电台数据类别信息的监督距离改进LLE算法中的邻域点搜索方法,并用于PIB参数的降维。将上述方法用于电台个体识别,采用概率神经网络作为识别分类器,对同型号同工作参数的10部电台进行个体识别实验。实验结果验证了上述方法的有效性,在接收信号信噪比为20dB时电台的正确识别率超过90%。
- 王金明徐玉龙徐志军
- 关键词:局部线性嵌入主成分分析