傅顺开
- 作品数:9 被引量:79H指数:5
- 供职机构:华侨大学计算机科学与技术学院更多>>
- 发文基金:中央高校基本科研业务费专项资金国家自然科学基金福建省自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 通过GPU加速数据挖掘的研究进展和实践被引量:9
- 2015年
- 将计算密度高的部分迁移到GPU上是加速经典数据挖掘算法的有效途径。首先介绍GPU特性和主要的GPU编程模型,随后针对数据挖掘主要任务类型分别介绍基于GPU加速的工作,包括分类、聚类、关联分析、时序分析和深度学习。最后分别基于CPU和GPU实现协同过滤推荐的两类经典算法,并基于经典的Movie Lens数据集的实验验证GPU对加速数据挖掘应用的显著效果,进一步了解GPU加速的工作原理和实际意义。
- 戴春娥陈维斌傅顺开李志强
- 关键词:数据挖掘GPU加速并行计算协同过滤
- 基于大数据的高校图书馆推荐系统仿真研究被引量:23
- 2013年
- 通过利用华侨大学500百万条用户日志数据的实验和分析,对高校图书馆引入推荐系统进行了定性和定量的讨论包括:高校图书馆需要推荐系统,构建推荐系统的可行性方案比较和选择,协同过滤推荐算法的介绍、比较和选择,评测指标介绍,基于系统离线评测发现了基于局部近邻学习的有效性和实施相关细节讨论。讨论和相关结论所基于的实验规模是同类讨论里较大的,对院校和工业界同行有一定参考价值。
- 张瑶陈维斌傅顺开
- 关键词:推荐系统协同过滤日志分析
- 贝叶斯网络结构加速学习算法被引量:1
- 2016年
- 结构学习是应用贝叶斯网络(BN)的基础。提出一种新的基于约束的学习类算法APC(Accelerated PC),它基于一系列局部结构的推导获得BN。APC不但继承了经典的PC(Peter&Clark)算法优先执行低阶条件独立(CI)测试的优点,而且能够从已执行的CI测试中推导相关拓扑信息,并利用其来挑选并优先执行更可能d-分割节点X和Y的候选CI测试。该策略可有效避免在搜索过程中执行无效的CI测试,例如APC算法在实验中较PC算法节省高达50%的计算量,同时实现了质量相同的学习效果。
- SEIN Minn傅顺开
- 关键词:贝叶斯网络
- 位置服务社交网络用户行为相似性分析被引量:27
- 2012年
- 基于位置的社交网络(LBSN)能够支持用户分享地理位置信息,网站中保存用户访问真实世界地理位置的记录构成用户的行为轨迹,但LBSN用户相似性的分析并没有从用户的地理位置轨迹上加以考虑。为此,提出基于划分层次,在不同的邻域半径下密度聚类的方法,探索基于位置的服务(LBS)平台上用户地理位置上相似性的度量。该方法在不同空间位置比例尺下观察用户访问各个聚类区域的次数,进而利用向量空间模型(VSM)计算用户在各个层级的相似性,最终以不同权重叠加各层级的用户相似性值,得出用户在地理空间行为上的相似性。基于国内某大型位置社交网站真实用户数据的实验结果表明,该方法能有效识别出访问地理位置相似的用户。
- 袁书寒陈维斌傅顺开
- 关键词:空间数据挖掘聚类
- 基于拓扑信息加速马尔科夫毯学习被引量:1
- 2015年
- 目标变量的马尔科夫毯(MB)是用于预测其状态的最优特征子集。提出一种新的约束学习类MB推导算法FSMB,它遵循后向选择的搜索策略,并依赖条件独立(CI)测试删除任意结点对之间的伪连接。与传统约束学习类算法不同,FSMB能从已执行的CI测试推导出不同结点扮演d-分割(d-separation)结点的优先等级;而后基于该信息在未来优先执行条件集中包含高优先级结点的CI测试,从而更快速地判断并删除伪连接边。该策略可帮助快速缩小搜索空间,从而大大提升学习效率。基于仿真网络的实验研究显示,FSMB在计算效率上较经典的PCMB和IPC-MB有显著的提升,而学习效果相当;在面对较大网络结构时(比如100和200个结点),甚至比公认最快速的IAMB还节省近40%的计算量,但学习效果要远优于IAMB。基于16个UCI数据集和4个经典的分类模型的实验显示,基于FSMB输出的特征集合所训练模型的分类准确率普遍接近或高于基于原有特征全集训练所得模型。因此,FSMB是快速且有效的MB推导算法。
- 傅顺开苏致祯Sein Minn吕天依
- 关键词:贝叶斯网络局部搜索
- 多维贝叶斯网络分类器结构学习算法被引量:1
- 2014年
- 传统多维贝叶斯网络分类器(MBNC)限制其模型结构必须是二分的,通过移除该限制可得到更准确的对关联分布建模的通用MBNC(GMBNC)。基于局部马尔可夫毯的迭代搜索,提出可准确学习GMBNC的算法IPCGMBNC。该算法由于无需学习全局贝叶斯网络(BN),可扩展性强。基于已知贝叶斯网络模型而随机生成的数据上所执行的实验显示,IPC-GMBNC可有效推导出目标结构;而且与传统的全局结构学习算法PC相比,IPC-GMBNC可节省大量的计算量。
- 傅顺开Sein Minn李志强
- 关键词:贝叶斯网络
- 协同过滤推荐研究综述被引量:7
- 2013年
- 推荐技术是目前在很多领域中广泛使用的技术之一。而协同过滤推荐算法是应用在推荐技术中很成功的算法。主要介绍了协同过滤推荐技术,总结了当前推荐算法的传统方法、改进算法以及性能评测方法。同时,分析了协同过滤推荐算法中的问题以及相应的解决办法。最后阐述了协同过滤推荐系统中仍需解决的问题和未来可能的发展方向。
- 张瑶陈维斌傅顺开
- 关键词:推荐系统协同过滤推荐算法稀疏性冷启动性能评测
- 一般贝叶斯网络分类器及其学习算法被引量:9
- 2016年
- 贝叶斯网络(BN)应用于分类应用时对目标变量预测有直接贡献的局部模型称做一般贝叶斯网络分类器(GBNC)。推导GBNC的传统途径是先学习完整的BN,而现有推导BN结构的算法限制了应用规模。为了避免学习全局BN,提出仅执行局部搜索的结构学习算法IPC-GBNC,它以目标变量节点为中心执行广度优先搜索,且将搜索深度控制在不超过两层。理论上可证明算法IPC-GBNC是正确的,而基于仿真和真实数据的实验进一步验证了其学习效果和效率的优势:a)可输出和执行全局搜索的PC算法相同甚至更高质量的结构;b)较全局搜索消耗少得多的计算量;c)同时实现了降维(类似决策树学习算法)。相比于绝大多数经典分类器,GBNC的分类性能相当,但兼具直观、紧凑表达和强大推理的能力(且支持不完整观测值)。
- Sein Minn傅顺开吕天依蔡奕侨
- 关键词:贝叶斯网络贝叶斯分类器局部搜索
- 多维贝叶斯网络分类器加速学习算法被引量:1
- 2015年
- 作为概率图模型,无限制多维贝叶斯网络分类器(GMBNC)是贝叶斯网络(BN)应用在多维分类应用时的精简模型,只包含对预测有效的局部结构。为了获得GMBNC,传统方法是先学习全局BN;为了避免全局搜索,提出了仅执行局部搜索的结构学习算法DOS-GMBNC。该算法继承了之前提出的IPC-GMBNC算法的主体框架,基于进一步挖掘的结构拓扑信息来动态调整搜索次序,以避免执行无效用的计算。实验研究验证了DOS-GMBNC算法的效果和效率:(1)该算法输出的网络质量与IPC-GMBNC一致,优于经典的PC算法;(2)在一个包含100个节点的问题中,该算法相对于PC和IPC-GMBNC算法分别节省了近89%和45%的计算量。
- 傅顺开李志强Sein Minn
- 关键词:贝叶斯网络