刘懿
- 作品数:2 被引量:29H指数:2
- 供职机构:清华大学信息科学技术学院计算机科学与技术系更多>>
- 相关领域:自动化与计算机技术更多>>
- 符号化近似SAX在时序数据挖掘中的应用研究被引量:2
- 2006年
- 聚类是数据挖掘研究中最常见的一种方法,可以作为规则发现、异常发现等其它数据挖掘操作的基础,一直以来都是数据挖掘的研究热点之一。股票数据是一种典型的时间序列数据,利用股票数据进行时间序列数据挖掘的研究既有一定的实际应用价值,也是国内外的热点问题之一。文章首次将一种新型符号化方法SAX[1]应用到标准普尔500指数的股票数据的聚类研究中,使用传统的欧氏距离和动态时间弯曲两种时间序列相似性度量方法进行实验。实验结果表明将SAX应用到股票数据聚类操作,可以得到更好的趋势聚类效果和更高的效率。
- 刘懿鲍德沛杨泽红赵雁南贾培发王家钦
- 关键词:时间序列聚类数据挖掘
- 新型时间序列相似性度量方法研究被引量:27
- 2007年
- 基于时间序列符号化后的特点,创造性地提出了一种新型相似性度量方法——符号化的统计向量空间法(SAX[1]Statistical Vector Space,SSVS)。将这种度量方法用于S&P500指数的股票数据聚类实验,并与经典相似性度量方法比较,结果表明这种新的方法能够高效地从整体趋势的角度度量时间序列的相似性,有很好的实际意义和应用前景。
- 刘懿鲍德沛杨泽红赵雁南贾培发王家钦
- 关键词:时间序列数据挖掘符号化