李宁
- 作品数:5 被引量:361H指数:4
- 供职机构:河北大学数学与计算机学院更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划河北省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于MapReduce的并行PLSA算法及在文本挖掘中的应用被引量:7
- 2015年
- PLSA(Probabilistic Latent Semantic Analysis)是一种典型的主题模型。复杂的建模过程使其难以处理海量数据,针对串行PLSA难以处理海量数据的问题,该文提出一种基于MapReduce计算框架的并行PLSA算法,能够以简洁的形式和分布式的方案来解决大规模数据的并行处理问题,并把并行PLSA算法运用到文本聚类和语义分析的文本挖掘应用中。实验结果表明该算法在处理较大数据量时表现出了很好的性能。
- 李宁罗文娟李宁罗文娟庄福振
- 关键词:MAPREDUCE语义分析
- 基于推荐的信任链管理模型被引量:17
- 2011年
- 针对目前信任链管理中信任计算时信任信息不完备的问题,提出了一种基于推荐的信任链管理模型RTCM(recommendation based trust chain management model)。通过构建信任网络,在信任链选择时考虑信任传递衰减、时间衰减、路径权重等因素,使得信任链搜索的时间复杂度大幅降低。充分包含了信任的相关信息,并利用加权紧密度对信任链上的推荐信任进行合并,同时给出了抑制节点恶意推荐的策略。仿真实验表明,该模型提高了网络的可信性。
- 田俊峰鲁玉臻李宁
- 关键词:信任推荐信任
- 基于本地主机传播行为的蠕虫预警新方法被引量:6
- 2007年
- 对于利用漏洞扫描技术传播的蠕虫进行预警,传统方法存在着诸如无法区分P2P数据流,无法检测利用多个端口传播蠕虫等问题。针对这些问题,结合对网络蠕虫行为模式的分析,提出了一种改进的算法,并建立了基于该算法的预警模型。最后对该方法的可行性和各项性能进行了分析,发现新方法能更有效的预警未知的网络蠕虫。
- 田俊峰张弛刘涛李宁
- 关键词:网络蠕虫预警蜜罐
- 基于间隔聚类合并的支持向量机反问题求解算法被引量:1
- 2009年
- 支持向量机(SVM)反问题研究的是如何把无类标签的数据集合分成两类才能得到最大的间隔。但是,求解反问题惊人的时间复杂度使得这种算法很难应用到具有一定规模的数据集上。先聚类后枚举所有划分的方法,聚类个数的确定会很大程度影响计算结果和运行效率。根据间隔和类间最近点的关系,提出了一种基于间隔聚类合并的反问题求解算法,通过不断合并类间距小于2倍间隔的子类,减少了子类个数和枚举次数。实验比较证明此算法比单纯的利用传统聚类解决此问题的算法有更好的性能。
- 朱杰李宁高相辉
- 关键词:支持向量机反问题
- 大数据下的机器学习算法综述被引量:330
- 2014年
- 随着产业界数据量的爆炸式增长,大数据概念受到越来越多的关注.由于大数据的海量、复杂多样、变化快的特性,对于大数据环境下的应用问题,传统的在小数据上的机器学习算法很多已不再适用.因此,研究大数据环境下的机器学习算法成为学术界和产业界共同关注的话题.文中主要分析和总结当前用于处理大数据的机器学习算法的研究现状.此外,并行是处理大数据的主流方法,因此介绍一些并行算法,并引出大数据环境下机器学习研究所面临的问题.最后指出大数据机器学习的研究趋势.
- 何清李宁罗文娟李宁
- 关键词:大数据聚类