您的位置: 专家智库 > >

宋云胜

作品数:9 被引量:16H指数:3
供职机构:山西大学计算机与信息技术学院更多>>
发文基金:国家自然科学基金山西省高等学校高新技术产业化项目国家重点基础研究发展计划更多>>
相关领域:自动化与计算机技术理学医药卫生更多>>

文献类型

  • 6篇期刊文章
  • 2篇学位论文

领域

  • 4篇自动化与计算...
  • 4篇理学
  • 1篇医药卫生

主题

  • 4篇数据划分
  • 2篇子集
  • 1篇单位元
  • 1篇药量
  • 1篇药效
  • 1篇运行时间
  • 1篇支持向量
  • 1篇支持向量机
  • 1篇指纹
  • 1篇指纹图
  • 1篇指纹图谱
  • 1篇数据压缩
  • 1篇统计分析
  • 1篇剖分
  • 1篇谱效关系
  • 1篇中药
  • 1篇中药指纹图谱
  • 1篇主成分
  • 1篇主成分分析
  • 1篇相似度

机构

  • 8篇山西大学
  • 1篇山东大学
  • 1篇教育部

作者

  • 8篇宋云胜
  • 3篇梁吉业
  • 1篇张晓琴
  • 1篇李顺勇
  • 1篇王杰
  • 1篇王树云

传媒

  • 2篇中国科学技术...
  • 2篇中北大学学报...
  • 1篇数据采集与处...
  • 1篇山东大学学报...

年份

  • 3篇2018
  • 1篇2017
  • 2篇2012
  • 1篇2011
  • 1篇2010
9 条 记 录,以下是 1-8
排序方式:
基于数据划分的核岭回归加速算法被引量:4
2018年
核岭回归(KRR)是一种重要的回归算法,具有可解释性、强泛化性能等优点,被广泛应用于模式识别、数据挖掘等领域;然而面对大规模数据时,核岭回归存在着训练效率较低的缺陷.为此,利用分而治之思想提出一种基于数据划分的核岭回归加速算法(PP-KRR).首先利用一簇平行超平面将当前数据所在的空间划分为m个互不相交的区域;其次在划分后的每个区域上训练KRR模型;最后每个KRR模型预测处在同一区域内的未标记实例.在真实数据集上与传统的算法进行实验比较分析,实验结果表明,提出的算法在保持一定预测精度的同时,能够获得更短的训练时间.
刘恩江宋云胜梁吉业
关键词:主成分分析
基于数据划分的k-近邻分类加速算法机理分析被引量:1
2018年
k-近邻(k NN)分类算法因具有不对数据分布做任何假设、操作简单且泛化性能较强的特点,在人脸识别、文本分类、情感分析等领域被广泛使用.k NN分类算法不需要训练过程,其简单存储训练实例并根据测试实例与存储的训练实例进行相似度比较来预测分类.由于k NN分类算法需要计算测试实例与所有训练实例之间的相似度,故难以高效地处理大规模数据.为此提出将寻找近邻的过程转化为一个优化问题,并给出了原始优化问题与使用数据划分优化问题的最优解下目标函数差异的估计.通过对此估计的理论分析表明,聚类划分可以有效的减小此差异,进而保证基于聚类的k-近邻分类(DC-k NN)算法具有较强的泛化性能.在公开数据集的实验结果显示,DC-k NN分类算法在很大程度上为测试实例提供了与原始k NN分类算法相同的k个近邻进而获得较高的分类精度.
宋云胜王杰梁吉业
关键词:K-近邻数据划分局部信息聚类
基于分层抽样的k近邻分类加速算法
2017年
k近邻(k nearest neighbor,kNN)分类作为数据挖掘中最典型的算法之一,以较高的泛化性能以及充足的理论基础被广泛应用。然而kNN在测试时需要计算待识别实例与所有训练实例之间的距离,以至于在面对大规模数据时需要大量的时间。为此,提出一种基于分层抽样的kNN加速算法(KNN based on stratified sampling,SS-kNN)。首先将训练实例所在的空间划分为若干个实例个数相等的区域,然后从每个区域内抽取实例,最后判定待识别实例落入划分区域中的哪一个,并从此区域以及相邻区域抽取的实例中寻找其k个近邻。与原始kNN算法以及基于随机抽样的kNN算法相比,SSkNN算法可以获得与其相近分类精度,但将其运行速度分别提高大约399倍和16倍。
宋云胜梁吉业
关键词:分层抽样数据划分运行时间
有限乘法群的特殊剖分
2011年
在群原有的运算和性质的基础上,定义了集合剖分的概念以及集合元素间的相关运算,拓展了有限乘法群的运算规律和性质.在两个子群满足两个特殊限定的条件下,首先对它们进行特殊剖分,然后利用它们对复杂的有限乘法群进行特殊的剖分,最后证明了特殊剖分的合理性.
宋云胜张晓琴
关键词:剖分子集单位元
中药指纹图谱数据及药效、药量数据的统计分析
中药指纹图谱因其能够标示中药材中相关成分的种类和相对含量,已经被广泛地应用于中药材质量检验和控制领域,而相似度的计算是利用中药指纹图谱的重要手段之一。在第一章中从相似度计算的两个步骤出发,分别讨论了均值法和主成分法构造对...
宋云胜
关键词:中药指纹图谱相似度谱效关系统计分析
线性模型下基于AIC准则的Bayes变量选择被引量:3
2010年
讨论了线性模型下Bayes变量选择问题。通过用AIC准则来修正经典的Bayes变量选择方法,构造修正后的子模型后验分布,并且通过仿真计算验证,修正后的后验分布可以提高变量选择精度。
王树云宋云胜
关键词:后验分布
组效关系中临界值的确定被引量:1
2012年
基于中药指纹图谱中的色谱峰与药效指标之间的灰色关联度,利用统计中的假设检验和非参数估计,对如何确定中药材(Traditional Chinese Medicine,TCM)中有效组分的临界值问题进行了研究.克服了主观设定临界值的缺陷,为探究中药中的有效组分提供了一种量化指标.实验结果表明:该方法能够有效地确定中药中的有效成分,验证了其可行性.
李顺勇宋云胜
关键词:非参数估计
基于划分与压缩的加速学习算法研究
现实世界中运转的许多复杂系统如基因表达、风险评估、经济预测等都可以抽象为特定的预测问题,而这些预测问题的高效解决将对社会的生产生活产生重大意义。机器学习作为一种解决这些复杂预测问题的重要方法, 它能够通过从经验中不断学习...
宋云胜
关键词:大规模数据数据划分数据压缩支持向量机LOGISTIC回归
文献传递
共1页<1>
聚类工具0