邱云飞
- 作品数:110 被引量:452H指数:11
- 供职机构:辽宁工程技术大学软件学院更多>>
- 发文基金:国家自然科学基金辽宁省高校创新团队支持计划辽宁省高等学校杰出青年学者成长计划更多>>
- 相关领域:自动化与计算机技术文化科学经济管理电子电信更多>>
- 露天采矿爆破振动对民房破坏的LS-SVM预测模型被引量:40
- 2012年
- 利用支持向量机学习原理,研究露天采矿爆破振动对民房破坏的预测问题。选取爆破振动幅值、主频率、主频率持续时间、灰缝强度、砖墙面积率、房屋高度、屋盖形式、圈梁构造柱、施工质量和场地条件作为露天采矿爆破振动对民房破坏的影响因素,以工程实际检测数据为训练样本,建立露天采矿爆破振动对民房破坏的LS-SVM预测模型。利用32组爆破实验数据作为学习样本对支持向量机进行训练,建立相应的预测模型并通过回代估计方法进行回检,误判率为0,用另外12组现场实验数据作为检验样本进行测试,测试结果良好。结果表明,LS-SVM预测方法的误判率低,判别精度高,为露天采矿爆破振动对民房破坏预测提供了一种行之有效的新方法,可以在实际相关工程中展开使用。
- 邵良杉白媛邱云飞杜占玮
- 关键词:露天采矿爆破振动LS-SVM
- 一种基于机器学习的突发事件敏感词检测方法
- 本发明公开了一种基于机器学习的突发事件敏感词检测方法,包括确定突发事件相关的违规主题词及语句;建立敏感词库与背景词库;利用确定的正样本、强负样本及敏感词库、背景词库训练决策树或贝叶斯分类模型,对敏感词和背景词设定不同权重...
- 刘硕愚邱云飞
- 基于ADO.NET的通用数据访问层设计方法研究被引量:9
- 2007年
- 在NET平台上进行应用软件开发时,为了实现与后台具体数据源的相对独立,首先将每个表与一个DataSet绑定,其次针对此表的访问需求给出访问接口,接着针对不同的数据源在该接口的基础上实现访问类,最后利用Factory模式根据配置文件信息动态实现对不同数据源的访问,从而实现了独立于数据源开发软件的目的。
- 邱云飞邵良杉
- 关键词:ADO.NET通用数据访问
- 稀疏条件下的重叠子空间聚类算法被引量:3
- 2019年
- 现有子空间聚类算法不能很好地平衡子空间数据的稠密性和不同子空间数据稀疏性的关系,且无法处理数据的重叠问题。针对上述问题,提出一种稀疏条件下的重叠子空间聚类(OSCSC)算法。算法利用l1范数和Frobenius范数的混合范数表示方法建立子空间表示模型,并对l1范数正则项进行加权处理,提高不同子空间的稀疏性和同一子空间的稠密性;然后对划分好的子空间使用一种服从指数族分布的重叠概率模型进行二次校验,判断不同子空间数据的重叠情况,进一步提高聚类的准确率。在人造数据集和真实数据集上分别进行测试,实验结果表明,OSCSC算法能够获得良好的聚类结果。
- 邱云飞费博雯刘大千刘兴
- 一种用于中文主题分类的CSVM算法被引量:1
- 2012年
- 提出一种新的级联支持向量机分类算法CSVM,结合AdaBoost算法框架与支持向量机(SVM)进行多分类处理。针对多分类问题中支持向量机处理样本数量多和计算时间过长的问题,引入最小闭合球算法对原始样本数据进行提取,以缩短SVM的训练时间。实验结果表明,CSVM算法具有与AdaBoost-SVM算法相似的精确度,而计算时间仅为AdaBoost-SVM算法的35%。
- 王光邱云飞史庆伟
- 关键词:支持向量机ADABOOST算法超平面
- 基于相关性及语义的n-grams特征加权算法被引量:2
- 2015年
- n-grams作为文本分类特征时易造成分类准确率下降,并且在对n-grams加权时通常忽略单词间的冗余度和相关性.针对上述问题,文中提出基于相关性及语义的n-grams特征加权算法.在文本预处理时,对n-grams进行特征约简,降低内部冗余,再根据n-grams内单词与类别的相关性及n-grams与测试集的语义近似度加权.搜狗中文新闻语料库和网易文本分类语料库上的实验表明,文中算法能筛选高类别相关且低冗余的n-grams特征,在量化测试集时减少稀疏数据的产生.
- 邱云飞刘世兴林明明邵良杉
- 关键词:语义相似度N-GRAMS特征加权
- 基于域变换函数和距离函数时间序列相似性概念体系
- 2010年
- 分析了域、变换函数和距离函数对相似性研究的影响,给出了具体的基于域、变换函数和距离函数的时间序列相似性概念体系,很好的解决了相似性概念的问题。同时,在相似性问题的研究策略上结合给出的相似性概念确定了"自底向上"的研究方式,为时间序列相似性研究工作的系统开展指明了方向。
- 刘威邱云飞张宇付巍巍刘海涛
- 关键词:时间序列变换函数距离函数
- 微博突发话题检测方法研究被引量:13
- 2012年
- 话题检测与跟踪模型不能很好地处理随意性强、用语不规范的微博短信息。为此,提出一种基于动态滑动窗口的微博突发话题检测方法。利用窗口提取具有潜在突发性的信息,采用结合语义的归一化词频-反文档频率函数计算特征权重,构建结合语义的空间向量模型,使用Single-Pass聚类算法思想对其加以改进,生成最终聚类。实验结果表明,该算法能获得较准确的突发话题检测结果。
- 邱云飞程亮
- 关键词:语义相似度空间向量模型话题检测与跟踪
- 基于网络结构和文本内容的群体画像构建方法研究被引量:11
- 2019年
- [目的/意义]在基于社会网络的用户画像研究中,针对传统用户建模难以处理复杂网络关系,群体构建多基于内容,以及群体相似度低或紧密性差的问题,提出基于网络结构和文本内容的群体画像构建方法。[方法/过程]首先,采用卷积神经网络方法,融合网络结构和文本内容两方面特征将网络用户表示成空间向量,其次,在k-means算法基础上结合模块度计算方法,对空间向量进行聚类,然后,在爬取的中英文数据集上分别进行对比研究,最后,从中文数据集中选取1000名重要性用户进行实例分析。[结果/结论]实验结果表明,该方法的密度值比基于内容的方法平均增加0.105,熵值比基于结构(含基于结构和内容)的方法平均减少0.955,实例分析进一步说明文中方法的可行性。
- 邱云飞张伟竹
- 关键词:社会网络网络关系文本内容聚类算法
- 基于方差的CHI特征选择方法被引量:31
- 2012年
- 通过分析特征词与类别间的相关性,在原有的卡方特征选择的方法上增加三个调节参数,使选出的特征词集中分布在某一类,且在某一类中尽可能地均匀分布,并使特征词在某一类中出现的次数尽可能地多。通过实验对比改进前后的卡方特征选择方法,基于方差的卡方统计(Var-CHI)方法使得查全率和查准率都得到了明显的提高。
- 邱云飞王威刘大有邵良杉
- 关键词:文本分类