山东省自然科学基金(ZR2009GZ007) 作品数:26 被引量:233 H指数:8 相关作者: 刘培玉 朱振方 赵静 李凤银 王乾龙 更多>> 相关机构: 山东师范大学 山东省分布式计算机软件新技术重点实验室 山东警察学院 更多>> 发文基金: 山东省自然科学基金 国家自然科学基金 山东省教育厅科技计划项目 更多>> 相关领域: 自动化与计算机技术 更多>>
基于AdaBoost的最小风险贝叶斯的垃圾邮件过滤算法 被引量:3 2011年 针对传统的单一算法对垃圾邮件进行过滤效果不理想的问题,在分析和研究最小风险贝叶斯算法和AdaBoost算法的基础上,将两者结合在一起,提出一种基于AdaBoost的最小风险贝叶斯的垃圾邮件过滤算法,将其应用到垃圾邮件过滤中,并分别与最小风险贝叶斯算法和AdaBoost算法的过滤效果进行比较,结果表明,该算法能够有效提高邮件过滤的准确率,改善垃圾邮件过滤系统的整体性能。 李茹 刘培玉 朱振方关键词:邮件过滤 最小风险贝叶斯 ADABOOST算法 基于Map Reduce的序列模式挖掘算法 被引量:2 2012年 传统数据挖掘算法在处理海量数据集时计算能力有限。为解决该问题,提出一种基于Map Reduce的分布式序列模式挖掘算法MR PrefixSpan。在PrefixSpan算法的基础上,对模式挖掘任务进行分割,利用Map函数处理由不同前缀得到的序列模式,并行构造投影数据库,从而提高挖掘效率及简化搜索空间。采用Reduce函数对中间结果进行规约,得到全局序列模式。在Hadoop集群上的实验结果表明,MR PrefixSpan能减少数据库扫描时间,具有较高的并行加速比和较好的可扩展性。 刘栋 尉永清 薛文娟关键词:并行处理 MAP PREFIXSPAN算法 HADOOP平台 引入共享近邻加权图的Chameleon算法 被引量:6 2012年 针对Chameleon算法中采用距离函数度量数据点间的相似度,导致距离相近的两个点可能仅拥有很少的共同特征,最小二分实际操作困难,合并时需要人工指定阈值以及一旦合并完成后不能撤销的问题,对Chameleon算法进行改进,提出一种引入共享近邻加权图(WSnnG)的Chameleon算法。该算法以数据对象间的共享近邻数来衡量相似度,进一步构造WSnnG,再利用网络模块性评价函数指导最小二分,然后以结构等价相似度作为合并的依据,最后通过引入内聚度度量函数解决合并后不能撤销的问题。在UCI数据集及4个二维人造数据集上的实验结果表明,该算法在聚类精度和运行时间方面具有更好的效果。 薛文娟 刘培玉 刘栋基于双线性对的无证书签名与群签名方案 被引量:1 2011年 传统数字签名方案的证书存储和管理开销较大,基于身份的数字签名方案无法解决其固有的密钥托管问题,而无证书签名方案无需使用公钥证书,且没有密钥托管问题。为此,提出一个基于双线性映射的无证书签名方案,并在随机预言机模型下证明其安全性。在此基础上设计一个无证书群签名方案,其安全性建立在计算Diffie—Hellman问题的困难性假设上。性能分析表明,2种签名方案在保证安全性的前提下,具有较高的执行效率。 李凤银 刘培玉 朱振方关键词:无证书密码体制 群签名 双线性映射 随机预言机 基于网格的TCP网络日志二次聚类算法 被引量:3 2011年 为了处理网络日志规模过大及其相关问题,根据TCP传输协议的特征,提出一种基于网格的TCP网络日志二次聚类算法(Grid-based TCP Two-step Clustering,GTTC)。通过分析TCP连接过程,采用划分网格的方式把每一条TCP报文日志进行网格内初次聚类,再把初次聚类簇进行网格间二次聚类,最后生成表达整个TCP连接的唯一的日志记录。该算法结合数据库技术,不需预设类簇个数k,可以自主决定生成的类簇。另外,该算法还可以处理实际的动态数据,实现增量式聚类,删除已聚类数据,处理新来网络日志。真实的网络环境测试证明,该算法既大大压缩了TCP日志记录存储量,又保证了日志记录的完整性和准确性,并且不影响用户的正常网络通信。 张珠玉 刘培玉 迟学芝关键词:TCP 网络日志 网格聚类 强不可否认的指定验证者代理签名方案 被引量:2 2011年 为了保护原始签名者的个人隐私,同时更好地确保代理签名的强不可否认性,在代理授权阶段引入指定验证者的思想,构造了一个基于离散对数难题的强不可否认的指定验证者代理签名方案。新方案不仅实现了只有代理签名者才能验证原始签名者的授权签名,而且确保了当代理签名者否认代理签名时,指定验证者可以在不造成安全隐患的前提下,向公众验证签名,指认代理签名者的身份。性能分析表明,该方案具有较高的效率,且满足代理签名的各种安全性要求。 崔涛 刘培玉 李凤银关键词:代理签名 指定验证者 离散对数 应用于入侵取证的改进信息增益算法 被引量:1 2011年 基于信息增益算法的特征选择虽然能够较好地解决入侵取证中存在的数据高维海量问题,但由于没有考虑特征之间的关系,导致特征子集中存在着冗余特征,从而影响了入侵取证的速度和精度,由此提出一种改进的基于特征冗余度的信息增益算法。通过添加对特征之间冗余度的判断,在删除无关特征的同时过滤了冗余特征,使特征子集得到有效精简。经实验验证,该算法能有效地选择特征向量,保证检测精度,提高检测速度。 贾娴 刘培玉 公伟关键词:入侵取证 信息增益 基于LDA的新闻话题子话题划分方法 被引量:18 2013年 针对目前网络热点新闻话题中存在的难以区分一个话题下的多个子话题现象,提出一种基于LDA模型的子话题划分方法.首先应用LDA模型对新闻文档进行建模,采用贝叶斯标准方法确定最优主题个数,使LDA模型拟合文档性能达到最佳;其次针对子话题间文本相似度较高的特点,引入主题特征词相关性分析,采用改进的KL距离公式,计算新闻文档之间相似度,有效区分了文档内容相似但话题重点不同的报道;最后通过single-pass增量聚类算法进行文档聚类,实现子话题划分.实验验证了改进后的相似度计算方法的有效性,实验结果表明该方法能够有效地提高热点新闻话题子话题划分的准确率. 赵爱华 刘培玉 郑燕关键词:KL距离 相似度计算 高效的无证书签名方案 被引量:16 2011年 传统的数字签名方案存在证书的存储和管理开销大的问题,基于身份的数字签名方案无法解决其固有的密钥托管问题,而无证书签名方案不需使用公钥证书,而且没有密钥托管问题,是目前的一个研究热点。基于双线性映射设计出一个无证书签名方案,并在随机预言机模型下证明了它的安全性。该无证书签名方案在签名和验证阶段共需要两个双线性映射运算,具有较高的执行效率。签名方案的安全性建立在计算Diffie-Hellman问题的困难性假设上。性能分析表明,设计的签名方案在保证安全性的前提下,具有较高的执行效率。 李凤银 刘培玉 朱振方关键词:无证书密码体制 双线性映射 计算DIFFIE-HELLMAN问题 随机预言机 基于细分变异算子策略的遗传算法 被引量:1 2012年 针对基本遗传算法局部搜索能力不强以及早熟的问题,提出基于细分变异算子的遗传算法(Genetic Algorithm Based on Subdividing Mutation,SMSGA)。SMSGA将变异算子依据进化历程分成大步前进算子和最优调教算子。大步前进算子防止遗传早熟现象的发生;最优调教算子加强局部搜索的能力。同时,为加快算法收敛速度,对遗传操作实施策略进行优化,引入了路由选择操作。选用3个典型的测试函数在MATLAB平台中对该算法与基本遗传算法以及采用双变异率的改进遗传算法进行比较分析,结果表明,SMSGA可以有效的避免遗传算法中存在的局部搜索能力差和早熟现象的出现。 王乾龙 刘培玉关键词:遗传算法 精英保留