您的位置: 专家智库 > >

孟杰

作品数:13 被引量:76H指数:7
供职机构:天津财经大学中国经济统计研究中心更多>>
发文基金:国家社会科学基金国家自然科学基金全国统计科学研究计划项目更多>>
相关领域:经济管理自动化与计算机技术社会学理学更多>>

文献类型

  • 10篇期刊文章
  • 3篇会议论文

领域

  • 7篇经济管理
  • 4篇自动化与计算...
  • 3篇社会学
  • 3篇理学
  • 1篇金属学及工艺
  • 1篇电子电信
  • 1篇水利工程
  • 1篇医药卫生

主题

  • 3篇人口
  • 3篇估计量
  • 2篇中国省域
  • 2篇人口普查
  • 2篇省域
  • 2篇LOGIST...
  • 2篇粗糙集
  • 1篇调查问卷
  • 1篇行业就业
  • 1篇依赖度
  • 1篇异常值
  • 1篇引力模型
  • 1篇有界
  • 1篇人口抽样
  • 1篇人口抽样调查
  • 1篇人口数据
  • 1篇人口增长
  • 1篇人口增长率
  • 1篇人口总数
  • 1篇生产函数

机构

  • 13篇天津财经大学
  • 1篇河北经贸大学
  • 1篇中国农业银行
  • 1篇中国农业银行...

作者

  • 13篇孟杰
  • 9篇杨贵军
  • 2篇孙玲莉
  • 1篇李春林
  • 1篇王双喜
  • 1篇王欣

传媒

  • 4篇统计与信息论...
  • 2篇数理统计与管...
  • 1篇模糊系统与数...
  • 1篇数量经济技术...
  • 1篇计算机应用
  • 1篇经济统计学(...

年份

  • 1篇2019
  • 3篇2018
  • 2篇2017
  • 2篇2016
  • 3篇2015
  • 2篇2014
13 条 记 录,以下是 1-10
排序方式:
基于赤池信息准则的分类回归决策树剪枝算法被引量:10
2014年
决策树剪枝可以提高决策树的分类准确度。代价复杂度剪枝(CCP)等常用的剪枝算法,都以降低决策树的误判率作为剪枝依据。引入赤池信息准则(AIC)评价决策树的优良性,并提出了基于AIC的决策树剪枝算法,将分类正确概率和复杂度的综合评价作为剪枝依据。通过实例分析,基于AIC的剪枝算法能够得到高分类准确度的决策树,并没有出现过拟合或剪枝不充足等问题。
杨贵军孟杰王双喜
关键词:LOGISTIC回归
基于双系统估计量的中国非普查年人口总数估计被引量:8
2018年
针对当前中国非普查年人口总数估计方法的不足,本文提出利用人口抽样调查及其事后质量评估调查数据,构造基于捕获再捕获模型的非普查人口总数双系统估计量。首先,介绍双系统估计量的构造及其估计方法。其次,研究如何利用刀切法构建双系统估计量的方差估计。最后,通过一组模拟数据演示非普查年人口总数双系统估计量及其方差估计的构造过程。本文的研究能显著提高中国非普查年人口总数估计的准确性和可靠性,并对未来中国人口抽样调查的方案设计提供理论指导。
孟杰杨贵军
关键词:人口抽样调查
人口名录库及其在人口普查中的应用被引量:12
2018年
在人口普查工作中更广泛地使用行政记录,不仅是中国国家统计局"十三五"时期统计改革发展规划纲要的重要内容,更是当前国外人口普查工作的前沿趋势。解析其它国家的可复制经验发现,人口普查中使用行政记录的关键在于如何充分利用不同来源的行政记录构造和应用人口名录库。为此,首先解析人口名录库的构造过程及其中的技术细节,如行政记录的选择、行政记录的统计化编辑以及多源行政记录的整合。其次,探究人口名录库应用于中国人口普查的思路和方法,包括普查年人口总数估计、无回答处理和完善普查住户地址信息等。
孟杰沈文静
关键词:人口普查
省际流入人口的行业分布规律分析
省际流入人口的行业分布关系到省域劳动力资源的优化配置。各行业省际流入人口调查难以保障数据及时性和准确性。为此,本文改进引力模型,测算了省际流入人口的行业流入率及行业依赖度,估算了各行业就业人员中省际流入人口的规模。
杨贵军周亚梦孟杰
关键词:引力模型
修正Benford分布律及其模拟研究被引量:5
2017年
Benford分布律是常用的数据质量评估方法。通常,Benford分布律只适用于完整数据集的数据质量评估。对于完整数据集的有界子集,提出修正Benford分布律评估其数据质量,拓宽了Benford分布律的适用范围。随机模拟结果显示,新方法的统计性质比Benford分布律更好,评估结果更合理。
孟杰王欣张然
关键词:数据质量评估加权平均
基于AIC的粗糙集择优方法被引量:4
2018年
在实际应用中,当利用多种粗糙集构造算法所得到的多个粗糙集的误判率差异小时,误判率小的粗糙集并不总是具有最高预测准确度。利用粗糙集的分类规则构建Logistic模型,将拟合Logistic模型的AIC值作为该粗糙集的AIC值,用于粗糙集的择优。实例分析结果表明,采用新方法能够筛选出预测准确度较高的粗糙集。当多个粗糙集的误判率差异小时,新方法更可能选出预测准确度最高的粗糙集。
杨贵军于洋孟杰
关键词:LOGISTIC模型粗糙集
基于随机森林模型的分类数据缺失值插补被引量:26
2014年
缺失数据是影响调查问卷数据质量的重要因素,对调查问卷中的缺失值进行插补可以显著提高调查数据的质量。调查问卷的数据类型多以分类型数据为主,数据挖掘技术中的分类算法是处理属性分类问题的常用方法,随机森林模型是众多分类算法中精度较高的方法之一。将随机森林模型引入调查问卷缺失数据的插补研究中,提出了基于随机森林模型的分类数据缺失值插补方法,并根据不同的缺失模式探讨了相应的插补步骤。通过与其它方法的实证模拟比较,表明随机森林插补法得到的插补值准确度更优、可信度更高。
孟杰李春林
关键词:调查问卷分类数据数据挖掘
基于EMB多重插补法的线性模型系数估计量的模拟研究被引量:7
2016年
基于EMB多重插补法的线性模型系数估计量,分析其统计性质,并与PMM多重插补法以及DA插补法进行比较。模拟结果显示,随着无回答率增加,系数估计量的偏差绝对值、均方误差呈递增趋势,估计方差的递增趋势相对更显著。在完全随机无回答机制或随机无回答机制下,建议插补重数为15。在依赖被解释变量的非随机无回答机制下,建议插补重数可适当增大。在依赖其他变量的非随机无回答机制下,估计量的均方误差和估计方差的差异大,使用EMB多重插补法要谨慎。
杨贵军孙玲莉孟杰
基于CD生产函数的中国省域GDP数据质量评估
2017年
2000年以来有关中国政府统计数据质量的质疑此消彼长,新常态经济背景下GDP增长率更是人们关注的焦点。目前,中国已正式采纳IMF的SDDS。中国政府统计工作需要进一步研究适用于中国的数据质量评估方法。然而,有关中国省域GDP数据质量评估的研究相对较少,其评估方法与中国GDP数据质量评估方法也不尽相同。本文从省域差异、经济理论和动态变化的视角,以CD生产函数为基础,考虑各要素投入和科技进步与GDP之间的关系以及省域间差异的影响,建立适用于省域GDP数据质量评估的统计模型。综合要素投入产出弹性系数和异常值动态识别的评估结果表明,中国省域GDP数据质量在总体上较好,少数省域年度GDP被高估的可能性大。
孟杰杨贵军程江萍
关键词:CD生产函数异常值
基于AIC信息准则的粗糙集选择算法
粗糙集是数据分类的常用方法之一。采用不同的粗糙集构造算法,得到的分类规则并不总是一样。通常,误判率是粗糙集选择的标准。然而,粗糙集的误判率最低,并不意味着它的预测准确度最高。
杨贵军于洋孟杰
关键词:LOGISTIC回归粗糙集
共2页<12>
聚类工具0