您的位置: 专家智库 > >

江苏省普通高校研究生科研创新计划项目(xm04-36)

作品数:14 被引量:177H指数:9
相关作者:董逸生王永利钱江波刘学军徐宏炳更多>>
相关机构:东南大学南京工业大学宁波市公安局更多>>
发文基金:江苏省普通高校研究生科研创新计划项目江苏省高技术研究计划项目国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 14篇中文期刊文章

领域

  • 14篇自动化与计算...

主题

  • 13篇数据流
  • 5篇查询
  • 3篇连续查询
  • 2篇自适应
  • 2篇维数
  • 2篇滤波
  • 2篇KALMAN...
  • 2篇插值
  • 2篇插值小波
  • 1篇多数据流
  • 1篇多维数据
  • 1篇多维数据流
  • 1篇信息熵
  • 1篇序列数据
  • 1篇异常数据
  • 1篇异构
  • 1篇异构数据源
  • 1篇异构数据源集...
  • 1篇硬件
  • 1篇硬件加速

机构

  • 14篇东南大学
  • 2篇南京工业大学
  • 1篇福建中医学院
  • 1篇宁波大学
  • 1篇宁波市公安局

作者

  • 14篇王永利
  • 14篇董逸生
  • 13篇徐宏炳
  • 13篇刘学军
  • 13篇钱江波
  • 4篇杨雪梅
  • 1篇胡平
  • 1篇钱刚

传媒

  • 6篇计算机研究与...
  • 2篇电子学报
  • 2篇应用科学学报
  • 1篇自动化学报
  • 1篇东南大学学报...
  • 1篇计算机时代
  • 1篇计算机科学

年份

  • 4篇2007
  • 7篇2006
  • 2篇2005
  • 1篇2004
14 条 记 录,以下是 1-10
排序方式:
基于最大频繁项集信息熵的数据流变化检测被引量:1
2006年
应用最大频繁项集信息熵来进行数据流变化检测.采用了一种新的数据流差异度度量方法;提出了一种新的有效挖掘最大频繁项集的算法;给出了应用最大频繁项集信息熵进行数据流变化检测的算法.最后,对算法的时间效率和空间效率进行了分析.
刘学军徐宏炳董逸生钱江波王永利
关键词:数据流最大频繁项集变化检测数据流分析
数据流关键技术研究被引量:10
2004年
处理无限的连续数据流的应用日益流行,传统数据库对快速变化的数据流进行在线分析的支持存在很多限制,需要对已存在的技术进行广泛的研究扩展,构建新的系统管理流数据。本文回顾近来数据流管理系统领域的相关工作和流项目的研究情况;分析了连续查询处理的新需求和挑战及数据流系统新颖之处;重点研究包括数据模式,系统结构,连续查询语言,调度方法,相关算法和查询评价等关键技术。并提出在数据流研究方面的一些新看法。
王永利董逸生徐宏炳钱江波刘学军
关键词:数据库系统数据流数据存储数据查询数据模式
挖掘数据流中的频繁模式被引量:47
2005年
发现数据流中的频繁项是数据流挖掘中最基本的问题之一·数据流的无限性和流动性使得传统的频繁模式挖掘算法难以适用·针对数据流的特点,在借鉴FP-growth算法的基础上,提出了一种数据流频繁模式挖掘的新方法:FP-DS算法·算法采用数据分段的思想,逐段挖掘频繁项集,用户可以连续在线获得当前的频繁项集,可以有效地挖掘所有的频繁项集,算法尤其适合长频繁项集的挖掘·通过引入误差ε,裁减了大量的非频繁项集,减少了数据的存储量,也能保证整个数据集中项目集支持度误差不超过ε·分析和实验表明算法有较好的性能·
刘学军徐宏炳董逸生王永利钱江波
关键词:数据流流数据挖掘
分布式数据流增量聚集被引量:9
2006年
分布式处理是数据流管理中的主流技术,聚集是分布式数据流系统中一种重要的连续查询类型.在分布式数据流环境中,由于需要连续计算聚集值,并且在分布式网络中连续传送聚集值,导致系统的通信开销非常大.为了有效地减少网络中数据流的传输量,提出了一种近似增量聚集算法(approxi-matelyincremental aggregate over distributed data stream,AIADDS).算法增量地计算网络中各个站点的聚集值,只有当聚集值的改变超出给定的阈值才向其他站点传送聚集改变量,这样,可以显著地降低网络的数据传输量.作为算法核心的VSB-Tree能够有效地合并、存储来自孩子站点的聚集值,同时增量地向它的父站点传送聚集改变量.理论分析和实验结果表明,算法是行之有效的.
王永利徐宏炳董逸生钱江波刘学军
关键词:数据流分布式系统
基于最小生成树的数据流窗口连接优化算法被引量:4
2007年
与传统关系数据库不同,数据流管理系统主要处理并发的连续查询.由于查询可能随时增删,所以其主要关注适合查询增删的并发连续查询优化,而不是单条查询优化.提出适合频繁增删查询环境下的数据流窗口连接优化算法.对于新注册的查询以类似最小生成树算法写出数据流的探测序列,然后在不更改其他查询探测序列顺序的情况下尽量合并,减少重复计算.注册或删除查询并不影响其他的查询计划,不需要执行繁琐的查询计划迁移.理论分析和实验证明,该算法简单,优化性能在可接受的范围内,尤其适合查询更新频率较高的系统.
钱江波徐宏炳董逸生王永利刘学军杨雪梅
关键词:最小生成树连续查询
基于硬件加速的高速数据流连续实时聚集查询被引量:3
2007年
近年来,动态数据流环境下的聚集查询正成为一个热点研究问题.目前的相关算法主要是采用近似技术,以牺牲精度来换取处理速度的提高.然而,在高速数据流环境下,处理速度仍然难以满足需求.软硬件协同的高速数据流处理技术逐渐引起人们的关注.提出了一种基于硬件加速的高速数据流聚集查询方法,充分发挥硬件在处理速度上的优势和软件在灵活性方面的长处.算法是增量的,也实现了多窗口资源共享.最后,给出了算法的复杂度分析并实验验证了方法的有效性.
刘学军胡平徐宏炳董逸生钱江波王永利
关键词:数据流聚集查询软硬件协同
异构数据源集成中的模式映射技术被引量:32
2006年
模式映射是异构数据源集成中实现查询重形成(Reformulation)的关键技术,本文首先介绍了模式映射的集中式和非集中式集成体系,总结了定义模式映射的3种基本形式:GAV、LAV和GLAV,重点探讨了模式映射中的核心技术:模式匹配和映射生成,最后讨论了模式映射技术新的研究议题。
杨雪梅董逸生王永利钱江波钱刚
关键词:异构数据源集成模式映射
数据流上异常数据的在线检测与修正被引量:6
2006年
给出了带有遗忘因子改进的Kalman滤波预测算法,能够检测未来时刻的异常数据;提出了一种新颖的数据流上的异常数据修正方法,应用插值小波根据连续异常数据数量的不同,实现了可变插值尺度的异常数据修补,能够自适应修正精度.在实际电力负荷数据上的仿真实验证明这种方法可以在线准确地检测到异常数据,并能提供精确的异常数据修正.
王永利徐宏炳董逸生钱江波刘学军
关键词:数据流KALMAN滤波自适应插值小波
多数据流滑动窗口并发连接方法被引量:17
2005年
提出一种多数据流滑动窗口连接方法M3Join及其实现架构Roujoin·Roujoin由一个连接路由表和多个连接区组成,其内容根据并发连接请求设置,先将新元组插入缓冲区,然后根据其路由标记查找连接路由表进入合适的连接区执行连接或输出给用户·如果产生连接元组,则更改其路由标记后送回连接路由表,并反复迭代直到没有连接元组·由于共享中间结果,在处理多个并发查询时只需扫描流元组一遍·实验结果表明M3Join具有良好的性能,能够满足并发连接查询处理的需求·
钱江波徐宏炳王永利刘学军董逸生
关键词:数据流连续查询路由表
基于低阶近似的多维数据流相关性分析被引量:15
2006年
目前存在的多数据流相关性分析方法大多只针对于单属性维数据流,无法体现多变量组成的场与场之间真实的相关性.为了在资源受限的环境下快速检测多维数据流之间的相关性,本文提出一种新颖的基于典型相关性分析(CCA)的多维数据流相关性分析算法S treamCCA,针对传统的CCA计算中的性能瓶颈,提出为样本方差阵与协差阵组成的乘积阵降维的高效低价近似方法,在保持分析精度的前提下显著地提高了计算效率.经理论分析和实验证明,S treamCCA能够在线精确地识别两条多维数据流的相关关系,可以作为通用的预报和诊断分析工具广泛应用于数据流挖掘领域.
王永利徐宏炳董逸生钱江波刘学军
关键词:数据流数据流挖掘
共2页<12>
聚类工具0