您的位置: 专家智库 > >

邱越峰

作品数:4 被引量:188H指数:3
供职机构:复旦大学信息科学与工程学院计算机科学系更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇期刊文章
  • 1篇学位论文

领域

  • 4篇自动化与计算...

主题

  • 3篇数据库
  • 2篇数据管理
  • 2篇数据模型
  • 2篇XML数据
  • 1篇信息集成
  • 1篇数据存储
  • 1篇数据库技术
  • 1篇数据挖掘
  • 1篇数据质量
  • 1篇相似重复记录
  • 1篇聚类
  • 1篇关系数据库
  • 1篇XML
  • 1篇XML数据存...
  • 1篇XML数据管...
  • 1篇DBMS
  • 1篇DTD
  • 1篇INTERN...
  • 1篇查询
  • 1篇查询优化

机构

  • 4篇复旦大学

作者

  • 4篇邱越峰
  • 3篇周傲英
  • 2篇田增平
  • 1篇张龙
  • 1篇施伯乐

传媒

  • 1篇计算机学报
  • 1篇计算机应用
  • 1篇计算机科学

年份

  • 1篇2001
  • 2篇2000
  • 1篇1999
4 条 记 录,以下是 1-4
排序方式:
数据库技术:回顾与展望被引量:12
1999年
数据库系统的研究和开发在其三十年的历史中取得了巨大的成功,形成了一个数百亿美元的产业。数据库技术和系统的应用已经遍及各个领域,奠定了数据库系统作为当今社会信息基础设施核心技术的地位。尽管如此,数据库的研究和发展一刻也来曾停止过,传统的研究主要集中在增强和提高数据库管理系统(DBMS)的功能和性能上。但是,DBMS作为管理大容量数据的工具无疑会受到所管理的对象和所应用的环境的影响。目前。
周傲英邱越峰田增平施伯乐
关键词:数据库DBMS数据管理数据模型数据挖掘
一种高效的检测相似重复记录的方法被引量:104
2001年
如何消除数据库中的重复信息是数据质量研究中的一个热门课题 .文中提出了一种高效的基于 N- Gram的检测相似重复记录的方法 ,主要工作有 :(1)提出了一种高效的基于 N - Gram的聚类算法 ,该算法能适应常见的拼写错误从而较好地聚类相似重复记录 ,复杂度仅为 O(N) ;同时提出了该算法的改进形式 ,使其在检测的同时能自动校正单词的插入、删除错误 ,提高检测精度 .(2 )采用了一种高效的应用无关的 Pair- wise比较算法 ,该算法以单词间的编辑距离为基础 ,通过计算两记录中单词间的编辑距离来判断记录的相似与否 .(3)给出了一种改进的优先队列算法来准确地聚类相似重复记录 ,该算法使用固定大小的优先队列顺序扫描已排序的记录 ,通过比较当前记录和队列中记录的距离来聚类相似重复记录 .此外 ,该文构造了合适的实验环境并作了大量的算法实验 .在此基础上 ,文中分析了大量、翔实的实验结果从而验证了算法的科学性 .
邱越峰田增平季文贇周傲英
关键词:信息集成相似重复记录聚类数据质量数据库
基于关系的XML数据存储被引量:73
2000年
XML正成为Internet上数据表示与交换的标准 ,如何存储XML数据是一个关键问题。我们在系统实现时采用了基于关系数据库的存储方式。文章对于关系模式如何由DTD生成、XML数据如何存入、查询语句和查询的结果如何转化等问题 ,做了详细的探讨。
周傲英张龙梁宇奇邱越峰
关键词:XML数据存储关系数据库INTERNET网
XML数据管理关键技术研究
该文对XML数据管理的相关技术作了全面的研究.主要包括查询语言、查询优化、索引和存储管理,其中重点研究了XML数据查询和存储技术.该文的创新点如下:归纳和总结了当前各种XML查询语言,提出了XML查询语言的要素;提出了基...
邱越峰
关键词:DTD数据模型查询语言查询优化存储管理
文献传递
共1页<1>
聚类工具0