江苏省科技支撑计划项目(BE2009009) 作品数:22 被引量:135 H指数:5 相关作者: 钱雪忠 吴秦 刘渊 施亮 邓杰 更多>> 相关机构: 江南大学 成都信息工程大学 扬州大学 更多>> 发文基金: 江苏省科技支撑计划项目 国家自然科学基金 教育部科学技术研究重点项目 更多>> 相关领域: 自动化与计算机技术 更多>>
基于MapReduce的约束频繁项集挖掘算法 被引量:3 2015年 传统的约束频繁项集挖掘方法无法实现对较大数据量的快速处理,针对该问题,结合分布式框架Hadoop的分布式计算优势,提出一种基于MapReduce的约束频繁项集挖掘算法。将一个完整的挖掘任务分成若干个相对独立的子任务,根据用户自定义的约束条件对子任务进行并行挖掘,提高算法的执行效率。实验结果表明,该算法具有较好的实用性和良好的扩展性。 施亮 钱雪忠关键词:数据挖掘 频繁模式树 关联规则 Ad hoc网络中一种基于博弈论的退避算法 Ad Hoc网络在MAC层中使用的接入机制是IEEE 802.11 DCF,其中采用的二进制退避算法(BEB)并不能良好地解决各个节点接入信道的公平性问题。针对这一问题,在BEB退避算法中加入了博弈论模型,提出了GBEB... 刘涛 刘渊 谭铣康关键词:博弈论 退避算法 稳定性 文献传递 改进的粒子群模糊聚类算法 被引量:7 2013年 针对传统的模糊C-均值聚类算法对初始聚类中心较敏感、易陷入局部最优的缺点,将粒子群优化算法和FCM算法相结合,提出一种改进的模糊聚类算法。该算法利用粒子群算法的全局搜索能力代替FCM算法寻找初始聚类中心,使其跳出局部最优,实现模糊聚类。主要从反映数据集分类的类内紧致性程度和类间分离性程度的角度考虑,重新设计适应度函数。实验结果表明,提出的算法在聚类正确率和有效性指标上有更好的效果。 钱雪忠 李静 宋威关键词:模糊聚类 模糊C-均值聚类算法 粒子群优化算法 分离性 Ad hoc网络中动态阈值岭型函数退避算法 2010年 无线自组织网络(Ad hoc)在MAC层中使用IEEE802.11DCF的接入机制来解决节点传输竞争问题,为了解决高负载环境下的网络拥塞状况问题,在退避算法中加入了动态阈值和岭型函数来降低数据传输的冲突概率并利用NS2对改进的退避算法进行网络仿真。仿真结果表明,相对于传统的退避算法,在负载较重的网络中改进后的退避算法大概能够提高网络性能20%左右,优化后网络的时延、吞吐量和公平性均得到明显改善。 刘涛 刘渊关键词:无线自组织网络 动态阈值 退避算法 基于PLSI的标签聚类研究 被引量:4 2013年 针对现有的大众分类中标签模糊导致影响用户搜索效率的问题,使用概率潜在语义索引(probabilistic latent semantic indexing,PLSI)模型对标签进行潜在语义分析,经回火期望最大化(tempered exception maximization,TEM)算法训练得到在潜在语义下的条件概率,生成概率向量;在此基础上,提出凝聚式层次k中心点(hierarchical agglomerative K-mediods,HAK-mediods)聚类算法对概率向量进行聚类,并进行了相关对比实验。实验结果表明,HAK-mediods算法的聚类效果要好于传统的聚类算法,从而验证了该算法的可行性和有效性。 吴志媛 钱雪忠关键词:大众分类 基于Hadoop的并行FP-Growth算法的研究与实现 被引量:15 2015年 在PFP(Parallel FP-Growth)算法的基础上提出了一种负载均衡并行的挖掘算法LBPFP(Load-Balanced Parallel FP-Growth)算法,该算法在Hadoop框架实现并行计算的同时,在数据分发中利用负载均衡策略,使主节点均衡地向子节点分配数据.除此之外,在子节点进行数据处理的过程中利用剪枝策略,减少数据的处理量,该算法在提高并行计算能力的同时也大大缩小了数据的处理量.最后,通过实验分析表明该算法在大数据的处理中具有较好的效果,证实了该算法的可行性. 施亮 钱雪忠关键词:关联规则 负载均衡 FP-GROWTH 并行计算 基于流量预测的Ad hoc网络入侵检测方案 被引量:1 2011年 Ad hoc网络具有无线传输的介质、动态改变的拓扑、缺乏监督等特点,为解决其安全防御问题,提出并实现了基于网络流量预测的Ad hoc入侵检测系统。该系统主要包括节点检测和响应系统两个部分,网络中的节点采用节点检测引擎对网络流量进行预测,根据原始流量与预测流量的差值来判断目标节点的恶意性,并据此做出路由调整。实验结果表明,该系统具有较高的检测率和较低的误警率。 谭铣康 刘渊 刘涛 张恬关键词:ADHOC网络 入侵检测 基于约束投影的近邻传播聚类算法 被引量:4 2014年 提出了一种基于约束投影的近邻传播AP聚类算法。AP算法是在数据点相似度矩阵的基础上进行聚类的,很多传统的聚类方法都无法与其相媲美。但是,对于结构复杂的数据,AP算法往往得不到理想的结果。文中算法先对约束信息进行扩展,然后利用扩展的约束信息指导投影矩阵的获取,在低维空间中,利用约束信息对聚类结果进行修正。实验表明,文中算法与对比算法相比,时间性能更优,聚类效果更佳。 钱雪忠 赵建芳 贾志伟关键词:聚类 约束信息 基于UML图和动态切片的回归测试研究 被引量:2 2011年 重点将UML图和动态切片应用于回归测试中。针对现在应用于软件开发的UML图不能很好地满足软件测试的要求,引入了时序状态图和改进后的状态图,对两种图进行形式化定义,并且通过实例说明定义内容,其中时序状态图用于类间测试,改进后的状态图用于类内测试。对定义的图进行切片分析,形成测试步骤和测试算法。网上购物实例表明时序状态图和改进状态图可以提高回归测试效率。 宋建生 钱雪忠关键词:动态切片 软件测试 UML状态图 协同过滤算法中的用户相似性度量方法研究 被引量:25 2015年 传统协同过滤算法中的用户相似性度量方法基于用户之间共同评分项计算用户的相似度,用户-项目评分矩阵的数据稀疏问题会导致该相似度的计算不够准确。为此,提出一种新的用户相似性度量方法。该方法采用结合修正公式改进的Jaccard相似性系数计算用户之间的相似度,在计算过程中考虑用户之间共同评分项和所有评分项的关系,以及用户在共同评价项目上的评分差异对用户相似度的影响,从而获取更加精确的用户相似度矩阵。实验结果表明,与余弦相似性方法和修正的余弦相似性方法相比,该方法能提高预测准确度。 任看看 钱雪忠关键词:协同过滤 数据稀疏