冯伟森 作品数:10 被引量:50 H指数:4 供职机构: 四川大学计算机学院 更多>> 发文基金: 国家重点基础研究发展计划 国家高技术研究发展计划 更多>> 相关领域: 自动化与计算机技术 电子电信 更多>>
堆叠去噪自编码器在垃圾邮件过滤中的应用 被引量:13 2015年 针对垃圾邮件数量日益攀升的问题,提出了将堆叠去噪自编码器应用到垃圾邮件分类中。首先,在无标签数据集上,使用无监督学习方法最小化重构误差,对堆叠去噪自编码器进行贪心逐层预训练,从而获得原始数据更加抽象和健壮的特征表示;然后,在堆叠去噪自编码器的最上层添加一个分类器后,在有标签数据集上,利用有监督学习方法最小化分类误差,对预训练获得的网络参数进行微调,获得最优化的模型;最后,利用训练完成的堆叠去噪编码器在6个不同的公开数据集上进行测试。将准确率、召回率、更具有平衡性的马修斯相关系数作为实验性能评价标准,实验结果表明,相比支持向量机算法、贝叶斯方法和深度置信网络的分类效果,基于堆叠去噪自编码器的垃圾邮件分类器的准确率都高于95%,马修斯相关系数都大于0.88,在应用中具有更高的准确率和更好的健壮性。 李艳涛 冯伟森关键词:垃圾邮件 贝叶斯方法 基于UML和RUP的中小项目的设计和实现 被引量:3 2009年 近年来URUP(Unified Modeling Language and Rational Unified Process)已经被广泛应用于规范软件的开发过程中.随着软件的规模和复杂性不断加剧,软件危机已经变得越来越严重.解决这个问题的行之有效的办法是软件复用.鉴于软件复用的重要性并结合中小型项目的特点,作者在剪裁和改进RUP模型的基础上提出了一个SRUP模型.作者介绍了一些UML和RUP相关的概念,同时对RUP模型中现有问题进行分析并提出了改进的SRUP模型.为了验证新模型的功效,在建筑行业动态管理信息系统中应用此模型来指导开发过程.实践表明,此软件系统的开发效率和质量得到了显著地提高. 王建 冯伟森 李旭伟 黄伟 杨正元关键词:UML RUP 开发过程 软件复用 针对脉冲噪声的双窗口自适应中值滤波方法 被引量:8 2006年 针对中值滤波效果随滤波窗口大小和噪声密度而显著变化的不足,提出了将噪声检测和噪声滤除窗口相分离的方法,采用大窗口检测噪声和小窗口滤除噪声的策略、自适应脉冲噪声滤除策略以提高图象滤波性能。实验表明,该方法在噪声检测的准确性和噪声滤除的有效性方面均有极大提高,并且对不同密度的椒盐噪声都具有很好的滤波性能。 胡旺 冯伟森 李志蜀关键词:脉冲噪声 中值滤波 噪声检测 基于transformer的python命名实体识别模型 被引量:2 2022年 最近一些基于字符的命名实体识别(NER)模型无法充分利用词信息,而利用词信息的格子结构模型可能会退化为基于词的模型而出现分词错误。针对这些问题提出了一种基于transformer的python NER模型来编码字符-词信息。首先,将词信息与词开始或结束对应的字符绑定;然后,利用三种不同的策略,将词信息通过transformer编码为固定大小的表示;最后,使用条件随机场(CRF)解码,从而避免获取词边界信息带来的分词错误,并提升批量训练速度。在python数据集上的实验结果可以看出,所提模型的F1值比Lattice-LSTM模型高2.64个百分点,同时训练时间是对比模型的1/4左右,说明所提模型能够防止模型退化,提升批量训练速度,更好地识别python命名实体。 徐关友 冯伟森关键词:命名实体识别 PYTHON TRANSFORMER 基于KAD网络内容监督的关键技术研究 被引量:1 2013年 为了解决由于KAD消息的隐匿性造成对文件共享系统中内容难以监督的问题,一种通过对网络中指定节点的交互消息进行截获,并快速提取出对应消息内容的监督方法被提出。首先,对确定的目标节点使用ID名称映射方法,从消息中提取出其中的关键字HashID值。其次,使用轻量级的ID值逆向转换算法得到对应的语义内容,利用转换后的内容可进一步对该节点的威胁程度进行判定。最后,在eMule系统搭建的KAD网络中部署了实验,将0X10区域内10个节点作为监督对象,使用上述监督方法对发往目标节点的查询与发布请求消息进行拦截,并成功地得到对应的语义内容。实验结果表明了对网络监督的必要性以及该方法的可行性。 王建 冯伟森关键词:KAD 基于DHT的消息转发防御机制研究 2011年 DHT(Distributed Hash Tables)是结构化P2P(Peer to Peer)系统实现资源高效组织和定位的关键技术。对DTH系统中消息转发过程中的安全威胁及其解决方法进行了分析。以多路径算法为基础,对消息转发效率和安全性进行优化,提出了一种混合路由防御机制。首先结合迭代路由与递归路由的优点,设计了混合路由方式,保证了消息的转发效率并降低消息开销。然后改进了消息转发过程中的可靠性和消息源鉴别机制。最后,在四川大学校园网内进行了测试。仿真试验结果表明,采用混合路由下的防御机制在减少消息数量的同时提高了查询成功率,对于消息转发过程中的攻击有着较好的防御效果。 王建 陈兴蜀 冯伟森 杨邓奇关键词:DHT 路由 防御 基于粗糙集理论不完备信息系统的数据挖掘 被引量:16 2004年 提出了一种基于推广的粗糙集理论直接在不完备信息系统上进行数据挖掘的方法 ,并给出了该方法的算法和实例 .该方法利用粗糙集理论直接对不完备信息系统进行知识约简 ,然后根据获得的约简集建立知识层次树 ,利用规则的支持度阈值s0 和置信度阈值c0 从知识层次树的压缩搜索空间中提取不完备系统的规则集 .该方法保持了原始数据和数据挖掘所获得的知识的真实性 .另外 ,还提出了知识规则的上、下支持度 ,上、下置信度 ,规则粗糙度等概念 ,以便指导用户更好地利用数据挖掘所获得的知识 . 胡旺 冯伟森 李志蜀 韦力凡关键词:不完备信息系统 粗糙集 数据挖掘 一种增强自主访问控制安全性的方案 被引量:6 2003年 提出的自主访问控制系统的安全增强方案在修改客体的访问控制属性时,操作系统和被授权主体对修改进行评估和监控。采用数字双签名方案对授权主体和被授权主体进行身份鉴别,在不破坏自主访问控制的自主性的前提下,使访问控制属性的修改在安全、明确、受控的状态下进行,从而消除恶意程序对系统的攻击基础和环境,使采用DAC工作机制的操作系统的安全性得到增强。 陈兴蜀 李旭伟 沈昌祥 朱宏 冯伟森关键词:自主访问控制 强制访问控制 特洛伊木马 基于Kademlia协议的DHT网络的测量研究 被引量:1 2011年 针对目前缺乏对KAD网络节点特性研究的问题,对KAD网络的全域节点和局部域节点进行了测量和分析。首先,提出了新型分布式KAD爬行系统的架构,并利用该系统快速而完整地获取了KAD网络全域和特性域的节点信息。然后,对网络中的节点地理分布、节点ID前缀分布、存储节点前缀分布、存贮节点稳定性进行了研究和分析。最后,在分析的基础上,发现了KAD网络节点ID分布均匀、较不流行关键字的存贮节点与目标关键字的距离更近、网络中存贮节点比较稳定等特性。测量结果表明KAD网络的搜索机制是稳定而有效的。 吴麒 冯伟森关键词:KAD 爬虫 基于BP模型的KAD网络核心节点识别算法研究 2013年 针对在KAD网络中核心节点的识别问题,提出了一种基于BP模型对节点重要程度进行实时判定的方法。结合KAD网络测量的结果,对网络中核心节点的属性特征进行提取和归一化处理,获得了一组可分离度较高特征集合。采用MatLab设计相应的学习算法对BP网络进行训练,使结果收敛于预定误差区间。将完成训练的BP网络模型应用于对测试节点的判定,实验结果表明该方法可以实时地完成核心节点的判定,并且识别准确率可达到约70%。 王建 冯伟森 邱兴超 刘继 卢林关键词:反向传播算法 KAD网络