您的位置: 专家智库 > >

孟东霞

作品数:27 被引量:30H指数:3
供职机构:河北金融学院更多>>
发文基金:国家自然科学基金全国统计科学研究计划项目山西高校科技研究开发项目更多>>
相关领域:自动化与计算机技术文化科学电子电信经济管理更多>>

文献类型

  • 21篇期刊文章
  • 1篇学位论文

领域

  • 12篇自动化与计算...
  • 7篇文化科学
  • 3篇电子电信
  • 1篇经济管理
  • 1篇交通运输工程
  • 1篇政治法律

主题

  • 5篇数据集
  • 5篇不平衡数据
  • 4篇计算机
  • 4篇不平衡数据集
  • 3篇欠采样
  • 3篇教学
  • 3篇采样
  • 3篇大数据
  • 2篇电信
  • 2篇独立分量分析
  • 2篇舆情
  • 2篇语音
  • 2篇神经网
  • 2篇神经网络
  • 2篇最近邻
  • 2篇流动人口
  • 2篇聚类
  • 2篇互联
  • 2篇互联网
  • 2篇过采样

机构

  • 16篇河北金融学院
  • 6篇太原理工大学
  • 2篇桂林电子科技...
  • 1篇北京工业大学

作者

  • 22篇孟东霞
  • 4篇柳凌燕
  • 2篇张红霞
  • 2篇马建芬
  • 2篇姜志旺
  • 2篇乔永凤
  • 2篇任静怡
  • 1篇裘咏霄
  • 1篇何志强
  • 1篇封二英
  • 1篇安英博
  • 1篇李静
  • 1篇魏晓光
  • 1篇戎杰
  • 1篇陈刚
  • 1篇许美玲

传媒

  • 3篇统计与决策
  • 3篇计算机工程与...
  • 3篇无线互联科技
  • 2篇纳税
  • 1篇电脑开发与应...
  • 1篇电视技术
  • 1篇电声技术
  • 1篇知识经济
  • 1篇山西统计
  • 1篇电子元件与材...
  • 1篇太原理工大学...
  • 1篇中国新通信
  • 1篇商情
  • 1篇青年与社会(...

年份

  • 2篇2023
  • 2篇2021
  • 1篇2020
  • 2篇2018
  • 2篇2016
  • 5篇2014
  • 2篇2013
  • 2篇2007
  • 2篇2003
  • 1篇2002
  • 1篇2001
27 条 记 录,以下是 1-10
排序方式:
基于自然最近邻的不平衡数据欠采样方法被引量:1
2023年
针对不平衡数据集中的少数类样本在实际应用中分类准确率较低的问题,提出一种利用多数类样本的自然最近邻进行欠采样的数据处理方法。自然最近邻算法根据每个样本的分布特征动态地为样本选择数量不同的自然最近邻样本,通过自然最近邻的个数反映样本分布的疏密程度。文章所提方法先计算多数类样本在整体数据集中的自然最近邻,根据自然最近邻情况移除多数类中的噪声样本和局部密度较小的样本,再计算剩余样本的相似度,保留密集区域中的代表性样本,去掉部分冗余样本,获得平衡数据集。该方法的计算无须预先指定参数,减少了欠采样过程中多数类分类信息的损失。对比实验利用支持向量机对不同欠采样方法平衡后的12个数据集进行分类,结果表明此方法在大多数数据集上具有较优的分类性能,提升了少数类样本的分类准确率。
孟东霞魏晓光柳凌燕
关键词:不平衡数据集欠采样
基于电信大数据的流入人口统计研究被引量:1
2016年
电信运营商在为移动客户提供业务服务的同时,积累了用户在身份信息、位置变化信息和消费行为等方面的海量数据,客观反映出特定人群,特别是流动人口的数据变化规律,在流动人口的短周期统计、快速监测等方面提供了较为准确的判定依据。文章将基于电信部门获取的数据内容,结合大数据处理平台和数据挖掘技术确立某一地区中流入人口的统计研究思路。
孟东霞何志强安英博
关键词:流动人口电信数据HADOOP数据挖掘
高校网络舆情监控预警系统的设计与构建
2014年
针对高校传统舆情监控与预警手段的不足,本文设计构建了一个基于中文信息处理与挖掘技术的高校网络舆情监控预警系统,系统结合相关技术实现了互联网信息的采集、识别分析、热点推送与预警功能,为高校监测和解决公共危机和热点事件提供了技术手段。
孟东霞柳凌燕
关键词:高校舆情信息挖掘
利用自然最近邻的不平衡数据过采样方法被引量:2
2021年
针对现有过采样方法存在的易引入噪声点、合成样本重叠的问题,提出一种基于自然最近邻的不平衡数据过采样方法。确定少数类样本的自然最近邻,每个样本的近邻个数由算法自适应计算生成,反映了样本分布的疏密程度。基于自然近邻关系对少数类样本聚类,由位于同一类簇中密集区域的核心点和稀疏区域的非核心点生成新样本。在二维合成数据集和UCI数据集上的对比实验验证了该方法的可行性和有效性,提高了不平衡数据的分类精度。
孟东霞李玉鑑
关键词:不平衡数据集过采样聚类
一种改进的基于EASI的语音分离算法
2007年
独立分量分析是近年来发展起来的一门新的数字信号处理方法,因为不需要知道信号的先验信息而得到广泛应用。论文简单介绍了ICA的原理及EASI算法,并根据神经网络理论提出一种改进的EASI语音分离算法。
孟东霞马建芬乔永凤
关键词:语音分离独立分量分析EASI算法神经网络
基于校园网的教务管理系统的研究
教务管理是高校教育信息管理现代化的基础及关键,教务管理从传统的人工操作到信息管理自动化、网络化是势在必行.该文结合我校教务管理的实际情况,给出了基于校园网的教务管理信息系统的整体模型设计,并采用人工智能理论中专家系统的设...
孟东霞
关键词:教务管理专家系统关系数据库SQL
新形势下基于大数据视角的思想宣传工作研究
2018年
宣传思想是意识形态领域里的工作重点,也是新形势下决定文化前进方向和社会发展道路的关键,其工作对象是来自社会不同群体的群众,在年龄、学历、专业、地区等方面的特征千差万别。本文将结合大数据技术针对以上问题进行研究,在思想宣传工作手段、舆情预测及引导、宣传效果评估三方面进行方式和方法的创新,使得思想宣传工作能在真正掌握群众的思想现状、明确群众的精神需求和了解群众的基本诉求的基础上,实现主流意识形态的自然融入。
孟东霞戎杰王柳
关键词:大数据舆情
基于k近邻中心偏移因子的欠采样方法被引量:1
2023年
针对不平衡数据集在实际应用中分类效果较差的问题,文章提出一种基于k近邻中心偏移因子对多数类样本欠采样的数据处理方法。k近邻中心是样本的k个最近邻覆盖区域的中心点,所在位置随着k值的增加而发生偏移,偏移变化的波动程度用中心偏移因子来表示。中心偏移因子的值反映了样本周围的局部密度,数值较小的因子代表样本及其近邻处于密集区域,或近邻在样本的同一侧密集分布,样本可能为冗余样本。为了在不改变原始数据分布的前提下尽可能地删除冗余度较高的多数类样本,首先,移除多数类样本中的噪声点,计算多数类样本的中心偏移因子;然后,将多数类样本按照偏移因子的数值从低到高排序;最后,通过比较样本与k近邻的中心偏移因子来删除部分多数类样本,使数据集趋于平衡。实验使用支持向量机对多种欠采样方法平衡后的14个数据集进行了分类,实验结果表明,所提方法在大多数数据集上表现较优,有效提高了少数类的分类精度。
孟东霞孟东霞
关键词:不平衡数据集欠采样K近邻
面向小学的学习支持服务系统设计研究
2014年
为了填充学习支持服务在小学中的应用,笔者构建了面向小学生的学习支持服务系统,对学生、教师、家长、管理员各用户的需求进行分析,从功能模块、数据库结构等方面进行设计。在系统设计过程中,以重视小学生学习特点、学习过程、学习资源生态化、监督反馈交流为原则,加强学习支持服务系统在小学教育阶段的实际作用。
李静孟东霞巩潇然
关键词:学习支持服务小学生
构建信息技术平台 推进企业信息化发展
2002年
孟东霞
关键词:信息技术平台企业信息化信息资源共享
共3页<123>
聚类工具0