公共文化服务平台

2024年7月7日星期日

|

欢迎来到青海省图书馆•公共文化服务平台

登录 | 注册 | 进入后台

[APP下载]

[APP下载]

扫一扫,既下载

全民阅读
职业技能
专家智库
参考咨询

您的位置： 专家智库 > >

孟杰: 作品数：13 被引量：76H指数：7; 供职机构：天津财经大学中国经济统计研究中心更多>>; 发文基金：国家社会科学基金国家自然科学基金全国统计科学研究计划项目更多>>; 相关领域：经济管理自动化与计算机技术社会学理学更多>>

合作作者

杨贵军天津财经大学中国经济统计研究中...
孙玲莉天津财经大学中国经济统计研究中...
李春林河北经贸大学数学与统计学学院
王双喜中国农业银行股份有限公司
王欣天津市住房公积金管理中心武清管...

作品列表
供职机构
相关作者
所获基金
研究领域

文献类型

10篇期刊文章
3篇会议论文

领域

7篇经济管理
4篇自动化与计算...
3篇社会学
3篇理学
1篇金属学及工艺
1篇电子电信
1篇水利工程
1篇医药卫生

主题

3篇人口
3篇估计量
2篇中国省域
2篇人口普查
2篇省域
2篇LOGIST...
2篇粗糙集
1篇调查问卷
1篇行业就业
1篇依赖度
1篇异常值
1篇引力模型
1篇有界
1篇人口抽样
1篇人口抽样调查
1篇人口数据
1篇人口增长
1篇人口增长率
1篇人口总数
1篇生产函数

机构

13篇天津财经大学
1篇河北经贸大学
1篇中国农业银行
1篇中国农业银行...

作者

13篇孟杰
9篇杨贵军
2篇孙玲莉
1篇李春林
1篇王双喜
1篇王欣

传媒

4篇统计与信息论...
2篇数理统计与管...
1篇模糊系统与数...
1篇数量经济技术...
1篇计算机应用
1篇经济统计学（...

年份

1篇2019
3篇2018
2篇2017
2篇2016
3篇2015
2篇2014

共 13 条记录，以下是 1-10

全选清除导出

排序方式：

基于赤池信息准则的分类回归决策树剪枝算法被引量：10: 2014年; 决策树剪枝可以提高决策树的分类准确度。代价复杂度剪枝(CCP)等常用的剪枝算法,都以降低决策树的误判率作为剪枝依据。引入赤池信息准则(AIC)评价决策树的优良性,并提出了基于AIC的决策树剪枝算法,将分类正确概率和复杂度的综合评价作为剪枝依据。通过实例分析,基于AIC的剪枝算法能够得到高分类准确度的决策树,并没有出现过拟合或剪枝不充足等问题。; 杨贵军孟杰王双喜; 关键词：LOGISTIC回归

基于双系统估计量的中国非普查年人口总数估计被引量：8: 2018年; 针对当前中国非普查年人口总数估计方法的不足，本文提出利用人口抽样调查及其事后质量评估调查数据，构造基于捕获再捕获模型的非普查人口总数双系统估计量。首先，介绍双系统估计量的构造及其估计方法。其次，研究如何利用刀切法构建双系统估计量的方差估计。最后，通过一组模拟数据演示非普查年人口总数双系统估计量及其方差估计的构造过程。本文的研究能显著提高中国非普查年人口总数估计的准确性和可靠性，并对未来中国人口抽样调查的方案设计提供理论指导。; 孟杰杨贵军; 关键词：人口抽样调查

人口名录库及其在人口普查中的应用被引量：12: 2018年; 在人口普查工作中更广泛地使用行政记录,不仅是中国国家统计局"十三五"时期统计改革发展规划纲要的重要内容,更是当前国外人口普查工作的前沿趋势。解析其它国家的可复制经验发现,人口普查中使用行政记录的关键在于如何充分利用不同来源的行政记录构造和应用人口名录库。为此,首先解析人口名录库的构造过程及其中的技术细节,如行政记录的选择、行政记录的统计化编辑以及多源行政记录的整合。其次,探究人口名录库应用于中国人口普查的思路和方法,包括普查年人口总数估计、无回答处理和完善普查住户地址信息等。; 孟杰沈文静; 关键词：人口普查

省际流入人口的行业分布规律分析: 省际流入人口的行业分布关系到省域劳动力资源的优化配置。各行业省际流入人口调查难以保障数据及时性和准确性。为此，本文改进引力模型，测算了省际流入人口的行业流入率及行业依赖度，估算了各行业就业人员中省际流入人口的规模。; 杨贵军周亚梦孟杰; 关键词：引力模型

修正Benford分布律及其模拟研究被引量：5: 2017年; Benford分布律是常用的数据质量评估方法。通常,Benford分布律只适用于完整数据集的数据质量评估。对于完整数据集的有界子集,提出修正Benford分布律评估其数据质量,拓宽了Benford分布律的适用范围。随机模拟结果显示,新方法的统计性质比Benford分布律更好,评估结果更合理。; 孟杰王欣张然; 关键词：数据质量评估加权平均

基于AIC的粗糙集择优方法被引量：4: 2018年; 在实际应用中,当利用多种粗糙集构造算法所得到的多个粗糙集的误判率差异小时,误判率小的粗糙集并不总是具有最高预测准确度。利用粗糙集的分类规则构建Logistic模型,将拟合Logistic模型的AIC值作为该粗糙集的AIC值,用于粗糙集的择优。实例分析结果表明,采用新方法能够筛选出预测准确度较高的粗糙集。当多个粗糙集的误判率差异小时,新方法更可能选出预测准确度最高的粗糙集。; 杨贵军于洋孟杰; 关键词：LOGISTIC模型粗糙集

基于随机森林模型的分类数据缺失值插补被引量：26: 2014年; 缺失数据是影响调查问卷数据质量的重要因素,对调查问卷中的缺失值进行插补可以显著提高调查数据的质量。调查问卷的数据类型多以分类型数据为主,数据挖掘技术中的分类算法是处理属性分类问题的常用方法,随机森林模型是众多分类算法中精度较高的方法之一。将随机森林模型引入调查问卷缺失数据的插补研究中,提出了基于随机森林模型的分类数据缺失值插补方法,并根据不同的缺失模式探讨了相应的插补步骤。通过与其它方法的实证模拟比较,表明随机森林插补法得到的插补值准确度更优、可信度更高。; 孟杰李春林; 关键词：调查问卷分类数据数据挖掘

基于EMB多重插补法的线性模型系数估计量的模拟研究被引量：7: 2016年; 基于EMB多重插补法的线性模型系数估计量,分析其统计性质,并与PMM多重插补法以及DA插补法进行比较。模拟结果显示,随着无回答率增加,系数估计量的偏差绝对值、均方误差呈递增趋势,估计方差的递增趋势相对更显著。在完全随机无回答机制或随机无回答机制下,建议插补重数为15。在依赖被解释变量的非随机无回答机制下,建议插补重数可适当增大。在依赖其他变量的非随机无回答机制下,估计量的均方误差和估计方差的差异大,使用EMB多重插补法要谨慎。; 杨贵军孙玲莉孟杰

基于CD生产函数的中国省域GDP数据质量评估: 2017年; 2000年以来有关中国政府统计数据质量的质疑此消彼长,新常态经济背景下GDP增长率更是人们关注的焦点。目前,中国已正式采纳IMF的SDDS。中国政府统计工作需要进一步研究适用于中国的数据质量评估方法。然而,有关中国省域GDP数据质量评估的研究相对较少,其评估方法与中国GDP数据质量评估方法也不尽相同。本文从省域差异、经济理论和动态变化的视角,以CD生产函数为基础,考虑各要素投入和科技进步与GDP之间的关系以及省域间差异的影响,建立适用于省域GDP数据质量评估的统计模型。综合要素投入产出弹性系数和异常值动态识别的评估结果表明,中国省域GDP数据质量在总体上较好,少数省域年度GDP被高估的可能性大。; 孟杰杨贵军程江萍; 关键词：CD生产函数异常值

基于AIC信息准则的粗糙集选择算法: 粗糙集是数据分类的常用方法之一。采用不同的粗糙集构造算法，得到的分类规则并不总是一样。通常，误判率是粗糙集选择的标准。然而，粗糙集的误判率最低，并不意味着它的预测准确度最高。; 杨贵军于洋孟杰; 关键词：LOGISTIC回归粗糙集

全选清除导出

共2页<1 2>

执行隐藏清空

用户登录

用户反馈

标题：

*标题长度不超过50

邮箱：

*

反馈意见：

反馈意见字数长度不超过255

验证码：

看不清楚？点击换一张