西南财经大学统计学院统计研究中心 作品数:7 被引量:37 H指数:4 相关作者: 李好奇 朱玉峰 更多>> 相关机构: 四川大学电气信息学院 四川大学商学院 中央财经大学商学院 更多>> 发文基金: 国家自然科学基金 中央高校基本科研业务费专项资金 国家杰出青年科学基金 更多>> 相关领域: 理学 电气工程 经济管理 更多>>
非平衡样本下基于生成对抗网络过抽样技术的公司债券违约风险预测研究 被引量:7 2022年 本文基于我国在公开市场发行过信用类债券的违约数据,利用了基于Wasserstein距离的生成对抗网络模型和SMOTE抽样技术对违约样本进行过抽样以提高非平衡样本下违约风险模型的预测效果.为检验过抽样技术对分类模型的改进效果,实证分析对不同的重抽样样本类别比例下分类模型的预测结果进行比较.研究结果表明过抽样技术能够显著地分类模型的预测精度,而且预测效果随着样本类别比例达到平衡而不断提高.和经典的SMOTE抽样技术相比,基于Wasserstein距离的生成对抗网络过抽样技术不仅可以提高分类模型的AUC指标,同时还能显著地改进F1得分.研究结果表明通过生成对抗网络对少数类样本进行过抽样能够显著地提升机器学习算法对债券违约风险的预测效果,为研究非平衡样本下的债券违约风险预测提供一种新的解决思路. 姚潇 李可 李可有限二阶矩情形与重尾情形下的Hurst参数 2020年 Hurst参数被广泛应用于序列长记忆性与自相似性的刻画.该文从最初计算Hurst参数的R/S统计量出发,在有限二阶矩与重尾两种情形下,讨论R/S统计量计算的Hurst参数与自相似性、长记忆性及重尾特性之间的关系.在有限二阶矩情形下,R/S统计量计算的Hurst参数与自相似参数一致,并能刻画协方差定义的长记忆性.在无限二阶矩的重尾情形下,联系Hurst参数与长记忆性的协方差可能无限,很难讨论他们之间的关系.而R/S统计量与自相似参数及尾指数也没有必然联系.该内容能使已被广泛应用的Hurst参数的实际含义更清晰. 吴量关键词:HURST参数 长记忆性 自相似性 分数布朗运动 门槛回归模型中门槛值和回归参数的估计 被引量:4 2016年 门槛模型中有两个关键问题:门槛个数的选择和门槛参数的估计.本文提出的判罚光滑最小二乘方法同时解决这两个问题.本文的方法避免了为确定门槛个数所需的假设检验,计算简单.回归参数估计被证明是n-^(1/2)相合且渐近正态,门槛参数估计被证明是(n/h-)^(1/2)相合且渐近正态.数值模拟和实际例子结果显示本文方法有效可行. 蒋家坤 林华珍 蒋靓 YIP Paul Siu Fai关键词:门槛模型 ABSOLUTE 多变点检测问题的Shape-based BS算法 被引量:5 2019年 BS算法是时间序列多变点检测中最经典的算法之一,但是基于全局CUSUM统计量的识别过程会带来过多误判和较高的时间复杂度.BS算法是一种离线的序贯方法,因此没有充分利用数据的时序信息;另一方面,BS算法识别变点的原则是CUSUM统计量最大化,也没有考虑统计量构成序列的形态特性.鉴于此,提出一种基于局部形态识别的BS改进算法,命名为Shape-based BS算法.基于局部形态识别统计量,不仅大大降低计算复杂度,且降低了因变点间的互相干扰而带来的误判率,进而提升变点识别的稳健性.最后,将此算法应用到了电力系统的"场景压缩"问题上,具有满意的实用效果. 庄丹 刘友波 马铁丰风电外送断面极限输电能力的非参数回归估计 被引量:4 2017年 大规模风电的随机性和间歇性导致基于典型方式计算的通道极限输电能力(total transfer capability,TTC)有效性降低。提出一种TTC非参数回归估计技术,通过风电与负荷场景聚类形成代表性中心,采用二分法重复潮流计算各场景下含稳定约束的断面TTC值,提取各场景与所属中心场景间的属性偏差及TTC偏差作为特征数据样本,经过相关性检验与非参独立筛选后,利用基于三次B样条函数展开的Group Lasso算法对TTC偏差进行非参数回归估计。算例验证表明,该方法具备较强的非线性泛化能力,能以较高精度提取输电断面TTC运行规则的显性表达式,与传统方法相比具有更丰富的信息输出与更良好的解释性,可用于含风电外送断面电力系统TTC的在线快速估计。 刘挺坚 刘友波 刘若凡 刘俊勇 林华珍 葛从关键词:风电 GROUP 基于多尺度时序建模与估计的电力负荷数据恢复 被引量:16 2020年 针对电力负荷数据缺损及失真问题,从时序数据特性分析及建模与估计的角度给出负荷数据补全与恢复的方法。运用马尔科夫链与序贯蒙特卡洛模拟联合法抽取负荷统计特性;基于电力负荷波动的年、月、周、日的多尺度时序特征分析,建立电力负荷的多尺度时序特征建模。引入B-spline基函数展开法解决负荷模型的非参、变系数问题,并给出负荷模型中关键参数的估计方法。采取误差多指标评判方法确定B-spline节点最优数量与样条最优次数。根据所得负荷恢复模型提出周尺度的电力负荷缺失数据恢复方法,并给出年度等长时段日负荷数据恢复思路。经实际算例验证,该文所提方法准确有效,具备工程应用价值。 张帅 杨晶显 刘继春 刘俊勇 林华珍基于混合效应模型的医保费用测算及监控 被引量:1 2015年 近几年医改的一个核心内容就是医保支付方式的改革。2012年12月,人力资源和社会保障部、财政部、卫生部三部门联合出台了《关于开展基本医疗保险付费总额控制的意见》,提出在未来两年里,在所有医疗保险统筹地区实行总额预付工作。实行总额预付制的关键是如何科学合理的测算每家医院的预算总额。本文利用线性混合效应模型分别对某市684家医院的病人数,平均费用进行建模,给出每一家医院来年医保费用的合理参考,并且利用模型中的随机效应项自动识别医保费用和病人数异常的医院,为医保监管机构的监管提供科学依据。 李好奇 林华珍 张兴凤 朱玉峰 张伟关键词:总额预付 医保费用