陈志飞
- 作品数:7 被引量:30H指数:3
- 供职机构:河海大学更多>>
- 发文基金:国家自然科学基金国家科技支撑计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种基于映射机制的水利信息资源检索方法被引量:1
- 2017年
- 在水利信息资源元数据统一检索过程中,针对水利信息资源元数据模式的多样性导致的语义不一致和用户资源视图展示需求不一致的问题,文中提出一种双重映射机制,通过语义关系映射解决不同类型元数据语义不一致的问题,通过视图关系映射解决用户资源视图按需配置问题。文中设计与实现的两种关系映射模型灵活高效、可扩展性强,有效地解决了上述两种问题。
- 刘艺冯钧唐志贤陈志飞徐欢张立霞
- 关键词:元数据关系映射
- 一种改进的协同过滤推荐算法被引量:6
- 2017年
- 推荐系统在电子商务中应用广泛,协同过滤是推荐系统中应用最为成功的推荐技术之一。随着电子商务系统数据不断增加,用户-项目评分矩阵稀疏性问题日趋明显,成为推荐系统的瓶颈。本文提出基于LDA的协同过滤改进算法,提升稀疏评分矩阵下的推荐质量。首先,根据用户与项目评分矩阵,建立LDA模型,得到用户-项目概率矩阵,作为协同过滤的原始数据;然后根据属性对项目聚类,对用户-项目概率矩阵进行裁剪;最后,考虑上下文信息,在传统协同过滤相似度计算基础上,通过引入时间因子函数改进相似度计算公式。在Movie Lens数据集上的实验结果表明,本文提出模型的MAE指标优于传统协同过滤算法。
- 刘艺冯钧魏童童陈志飞徐欢张立霞
- 关键词:LDA协同过滤聚类相似度计算
- 基于模式挖掘的中小河流暴雨洪水模式库被引量:5
- 2018年
- 传统神经网络预测方法在水文领域已经有较成功的应用,但对于一些资料匮乏地区进行洪水预报时,由于训练样本的缺失,模型参数难以满足要求,使用这些方法预报结果往往并不理想。本文提出构建适用于待预报流域的暴雨洪水模式库的新思想,对该流域历史水文数据进行符号化模式挖掘处理,然后通过分析频繁模式和洪水流量水文时间序列,完成中小河流暴雨洪水模式库构建。使用具有中小河流典型特征的昌化流域的历年水文数据进行实验,实验结果表明,采用本文模式挖掘方法构建中小河流暴雨洪水模式库,并利用模式库快速预报未来洪水流量过程线走势,具有准确性和流域适用性。
- 冯钧郭涛陈志飞
- 关键词:模式库水文数据
- 面向发布订阅的网状多级索引匹配方法
- 本发明公开一种面向发布订阅的网状多级索引匹配方法,属于信息技术处理领域。该方法针对现有的多级索引匹配算法在删除用户订阅条目时存在全表扫描的问题,提出了改进后的网状多级索引结构,能够在确保索引效率的情况下,利用订阅条目的链...
- 冯钧张立霞王冲陆佳民徐维纲张进孔胜球刘艺徐欢陈志飞
- 面向发布订阅的网状多级索引匹配方法
- 本发明公开一种面向发布订阅的网状多级索引匹配方法,属于信息技术处理领域。该方法针对现有的多级索引匹配算法在删除用户订阅条目时存在全表扫描的问题,提出了改进后的网状多级索引结构,能够在确保索引效率的情况下,利用订阅条目的链...
- 冯钧张立霞王冲陆佳民徐维纲张进孔胜球刘艺徐欢陈志飞
- 文献传递
- 基于Hadoop的分布式CIF四叉树索引方法
- 2016年
- 针对矩形空间数据对象,以传统CIF四叉树索引技术为基础,利用Hadoop平台与MapReduce并行编程模型,采用"分而治之"的思想,对数据空间进行划分,设计适用于分布式环境的创建索引、相交查询、区域删除的并行算法。在此基础上,通过改变数据集中矩形对象的数目与map数进行实验,分析并行创建与相交查询的效率。实验结果表明,对于大数据量的数据集与多数据集,并行创建与查询可以提高处理效率。
- 徐欢冯钧张鹏程唐志贤刘艺陈志飞张立霞
- 关键词:HADOOPMAPREDUCE分布式环境
- 一种基于Apriori算法的优化挖掘算法被引量:18
- 2016年
- 通过对关联规则挖掘基本问题的分析,总结经典挖掘算法Apriori的3点不足,针对不足进行相应改进:1)改变数据库映射方法,避免反复扫描数据库;2)确定非频繁项集,并确保其不与其它项连接,避免产生大量候选项;3)采用交运算,解决候选项集与事物模式匹配阶段耗时过多的问题。此外,为了验证改进算法的有效性,采用水文历史数据进行实验验证。实验结果表明,在支持度与置信度取不同值时,本文提出的改进算法IM-Apriori算法执行时间更短,效率更高。
- 陈志飞冯钧
- 关键词:数据挖掘关联规则水文数据