江西省教育厅科学技术研究项目(GJJ10446)
- 作品数:3 被引量:13H指数:2
- 相关作者:刘遵雄张恒秦宾郑淑娟陈俊更多>>
- 相关机构:华东交通大学江西财经大学更多>>
- 发文基金:江西省教育厅科学技术研究项目教育部人文社会科学研究基金江西省自然科学基金更多>>
- 相关领域:自动化与计算机技术经济管理更多>>
- L1正则化Logistic回归在财务预警中的应用被引量:11
- 2012年
- 线性模型和广义线性模型已广泛地用于社会经济、生产实践和科学研究中的数据分析和数据挖掘等领域,如公司财务预警,引入L1范数惩罚技术的模型在估计模型系数的同时能实现变量选择的功能.本文将L1范数正则化Logistic回归模型用于上市公司财务危机预报,结合沪深股市制造业ST公司和正常公司的T-2年财务数据开展实证研究,对比Logistic回归和L2正则化Logistic回归模型进行对比分析.实验结果表明L1正则化Logistic回归模型的有效性,其在保证模型预测精度的同时提高模型的解释性.
- 刘遵雄郑淑娟秦宾张恒
- 关键词:财务预警正则化技术逻辑回归
- 正则化最小二乘线性判别分析算法
- 2010年
- 线性判别分析(Linear Discriminant Analysis,LDA)是用于降维和分类的方法,然而在遇到小样本问题时,由于全局散布矩阵是奇异的,所以传统的LDA方法是不适用的。为了解决LDA的这种缺点,提出了基于最小二乘线性判别分析(Least Squares Linear Discriminant Analysis,LS-LDA)的正则化算法,在LS-LDA中分别加入关于加权矩阵的L1范数、L2范数和弹性网络的惩罚项、来解决小样本问题,使模型具有鲁棒性和稀疏性。在对回归分析、正则化方法和LS-LDA相关技术进行深入分析的基础上,构建正则化最小二乘线性判别分析框架算法,实现数据降维。结合标准文本数据集进行实验,采用KNN(K-Nearest-Neighbor)分类器进行文本分类。实验结果表明,正则化的LS-LDA具有很好的分类性能,其中以加入了弹性网络惩罚项的LS-LDA最优。
- 刘遵雄曾丽辉
- 关键词:线性判别分析
- 基于非负矩阵分解特征提取的垃圾邮件过滤被引量:2
- 2010年
- 随着垃圾邮件的不断增多,它的危害性越来越严重,为了消除这种危害性,垃圾邮件的过滤技术就显得异常重要。由于垃圾邮件数据具有稀疏性、高特征维数和多重相关性等,所以直接对它进行分类的话会造成运算量很大和错误分类的问题。本文针对这些问题,先用非负矩阵分解的方法对实验数据进行特征提取,然后再用分类方法对它进行分类。在实验中,比较之后发现经过分解之后的数据比没有经过分解的数据有更高的分类准确率。
- 陈俊刘遵雄
- 关键词:垃圾邮件非负矩阵分解