您的位置: 专家智库 > >

惠州市科技计划项目(2009G024)

作品数:2 被引量:7H指数:1
相关作者:蔡昭权张锐吴文忠卢庆武徐震宇更多>>
相关机构:惠州学院广东金融学院华南理工大学更多>>
发文基金:惠州市科技计划项目广东省科技计划工业攻关项目广东省自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 1篇数据库
  • 1篇关系数据库
  • 1篇HDF5

机构

  • 2篇惠州学院
  • 1篇广东金融学院
  • 1篇华南理工大学

作者

  • 2篇蔡昭权
  • 1篇卢庆武
  • 1篇鲁梦平
  • 1篇黄翰
  • 1篇吴文忠
  • 1篇朱一帆
  • 1篇何翊宇
  • 1篇徐震宇
  • 1篇张锐

传媒

  • 1篇计算机工程与...
  • 1篇计算机工程与...

年份

  • 2篇2011
2 条 记 录,以下是 1-2
排序方式:
利用HDF5和Esper的高效外汇数据分析系统被引量:7
2011年
为解决目前关系型数据库由于死锁和阻塞等原因造成系统随数据量增加性能急剧降低的问题,本文提出结合HDF5和Esper的数据处理方法,利用HDF5(层次型数据存储格式)的强大I/O性能和数据类型自定义功能做数据存储,加快数据存储的速度。同时,结合Esper实时计算的高运算效率特征,设计出一套针对外汇计算行业的可移植的数据格式和函数库,解决了即时数据分析系统在存储、管理、交换、归档需求中出现的性能和效率问题。实验结果表明,在10G/天的数据量下,HDF5的数据读写性能比MSSQL要高80倍左右,结合Esper的毫秒级处理能力,能够做到外汇数据的实时计算。系统对于数据处理分析和实时性要求极高的情况有较高的应用价值。
蔡昭权吴文忠卢庆武张锐
关键词:关系数据库HDF5
基于文章要素影响分析的博客文章分类方法
2011年
现有的博客文章分类的研究通常直接沿用传统文本分类方法,并没有结合博客自身的特点。研究基于文章要素的影响分析实现分类效果的改进。提出了一种简单的博客文本去噪方法,以保证博客数据的可靠性;提出了基于博客标签的中文词库扩展方法,用于改善中文分词效果,以提高博客分类的准确性;根据综合评价模型G1法计算博客文章中标题、标签、类别、首段、末段以及正文等文章要素的权重,分析它们对博客分类的影响。实验结果表明,研究提出的方法比传统的TFIDF方法有更好的分类效果。
鲁梦平黄翰蔡昭权朱一帆何翊宇徐震宇
共1页<1>
聚类工具0