曲武
- 作品数:37 被引量:149H指数:6
- 供职机构:北京启明星辰信息技术股份有限公司更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划中国博士后科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 知识发现与智能系统相融合的创新技术及其示范应用
- 杨炳儒谢永红曲武李晋宏张帆罗裕卫
- 该项目是新兴的知识工程、生物信息学与计算机技术等多学科交叉领域前沿重大问题的研究,是源于课题组率先提出的KDTICM(基于内在认知机理的知识发现理论;被评价为“原创性理论”;获3次重要国际奖励)的交融性研究中的原创性技术...
- 关键词:
- 关键词:知识工程专家系统
- 云环境下基于超球面投影分区的Skyline计算被引量:6
- 2013年
- 目前,Skyline查询在集中式数据库、分布式数据库、数据流及分类属性数据集上的良好应用前景,使其成为当前数据库界研究的重点和热点之一,受到了学术界和工业界的广泛关注,它作为一种重要的数据挖掘技术广泛应用于多目标优化、城市导航系统、用户偏好查询及约束决策、智能防御系统以及地理信息系统等领域。随着人类可以采集和利用的数据信息的急剧增长,如何处理大数据的Skyline查询成为急需解决的问题。针对云计算环境,在Map-Reduce框架下设计并实现了基于超球面投影分区的分布式Skyline算法HSPD-Skyline,其主要思想是通过对高维数据点的超平面投影映射,即由空间坐标转换为超球面坐标,可以有效提高分区内数据点的平均减枝力度,降低Skyline的计算代价。同时,使用基于空间分区树的启发式策略HA-SPT,进一步提高了HSPD-Skyline算法的处理效率。通过详细的理论分析和实验验证表明,在不考虑数据分布和进一步优化算法的条件下,提出的HSPD-Skyline算法的总体性能(可扩展性、Skyline查询时间等)优于同类算法。
- 雷婷王涛曲武韩晓光
- 一种实现互联网宣传监测目标评估的方法及装置
- 本申请公开了一种实现互联网宣传监测目标评估的方法及装置,包括:根据配置信息从选定的数据源中获取宣传监测目标的网页信息;对获取的各网页信息进行网站特征字分离,以获得相应的标题、正文、统计正文字数信息;对所述获得的各网页信息...
- 王君鹤曲武
- 文献传递
- 一种实现恶意代码标注的方法及系统
- 本发明公开了一种实现恶意代码标注的方法及装置,包括:将恶意代码的可移植的执行体(PE)文件进行处理,获取恶意代码的信息摘要签名和基准标注和纹理特征;根据基准标注及信息摘要签名,将属于同一恶意代码家族的纹理特征生成相应的纹...
- 曲武周涛毕学尧王君鹤
- 文献传递
- 一种基于纹理的分布式恶意代码检测方法、装置及系统
- 一种基于纹理的分布式恶意代码检测装置及方法;装置包括:纹理指纹提取单元,用于根据恶意代码PE文件生成恶意代码纹理指纹向量集合,提取待检测样本的纹理指纹向量;布隆过滤器索引结构建立单元,用于将恶意代码纹理指纹向量集合映射到...
- 曲武王君鹤周涛叶润国
- 文献传递
- 基于新型集成分类器的非平衡数据分类关键问题研究被引量:8
- 2011年
- 针对非平衡数据分类问题,提出了一种基于差异采样率的重采样算法(differentiated sampling rate algorithm,DSRA),基于DSRA设计了一种新的集成分类器(SVM-Ripper ensemble classifier,SREC)。SREC采用独特的分类器选择策略、分类器集成策略、分类决策方案,可获得较高的分类精度。同时,利用SREC对影响非平衡数据分类的关键问题进行了研究。结果表明,非平衡数据分类问题本质上是由正负样本类间非平衡、类内非平衡、样本规模以及样本非平衡度等诸多因素引起的,只有综合考虑这些因素才能更好地解决非平衡数据分类问题。
- 翟云杨炳儒曲武隋海峰
- 关键词:数据挖掘集成分类器
- 一种实现分布式网络安全防护的方法及系统
- 本申请公开了一种分布式网络安全防护的方法及系统,包括:将虚拟防火墙旁挂在虚拟交换机上;对不是来自或发往物理防火墙的数据流量,业务虚拟机判断是否已经过虚拟防火墙过滤,如果是,转发数据流量,否则,将该数据流量发往虚拟防火墙;...
- 李陟曲武
- 文献传递
- 一种实现互联网宣传监测目标评估的方法及装置
- 本申请公开了一种实现互联网宣传监测目标评估的方法及装置,包括:根据配置信息从选定的数据源中获取宣传监测目标的网页信息;对获取的各网页信息进行网站特征字分离,以获得相应的标题、正文、统计正文字数信息;对所述获得的各网页信息...
- 王君鹤曲武
- 一种实现恶意代码标注的方法及系统
- 本发明公开了一种实现恶意代码标注的方法及装置,包括:将恶意代码的可移植的执行体(PE)文件进行处理,获取恶意代码的信息摘要签名和基准标注和纹理特征;根据基准标注及信息摘要签名,将属于同一恶意代码家族的纹理特征生成相应的纹...
- 曲武周涛毕学尧王君鹤
- 文献传递
- 云环境下基于LSH的分布式数据流聚类算法被引量:3
- 2014年
- 近年来,随着计算机技术、信息处理技术在工业生产、信息处理等领域的广泛应用,会连续不断地产生大量随时间演变的序列型数据,构成时间序列数据流,如互联网新闻语料分析、网络入侵检测、股市行情分析和传感器网络数据分析等。实时数据流聚类分析是当前数据流挖掘研究的热点问题。单遍扫描算法虽然满足数据流高速、数据规模较大和实时分析的需求,但因缺乏有效的聚类算法来识别和区分模式而限制了其有效性和可扩展性。为了解决以上问题,提出云环境下基于LSH的分布式数据流聚类算法DLCStream,通过引入Map-Reduce框架和位置敏感哈希机制,DLCStream算法能够快速找到数据流中的聚类模式。通过详细的理论分析和实验验证表明,与传统的数据流聚类框架CluStream算法相比,DLCStream算法在高效并行处理、可扩展性和聚类结果质量方面更有优势。
- 曲武王莉军韩晓光
- 关键词:数据流聚类