国家科技成果重点推广计划(2003EC000001)
- 作品数:36 被引量:196H指数:8
- 相关作者:杨炳儒宋威徐章艳张伟张克君更多>>
- 相关机构:北京科技大学北华大学广西师范大学更多>>
- 发文基金:国家科技成果重点推广计划国家自然科学基金教育部科学技术研究重点项目更多>>
- 相关领域:自动化与计算机技术文化科学经济管理建筑科学更多>>
- 一种多标准决策树剪枝方法及其在入侵检测中的应用被引量:2
- 2007年
- 为提高决策树的适用性,以决策树在入侵检测中的应用为背景提出一种多标准的剪枝方法,使决策树程序能在参数调整后适应不同的应用.给出了用于描述决策树不同性能的一些参量,如稳定性、复杂度、分类能力等,用户可以根据具体情况对向量各分量的权重进行调整,逐步得到满足要求的决策树.实验结果表明,该算法能够根据入侵检测系统的具体需要,快速地构建相应的决策树,从而程序可被用于不同情况.该方法把由程序员决定决策树变成了由用户决定决策树,程序更通用,结果更合理.
- 李卫东宋威李欣杨炳儒
- 关键词:入侵检测决策树剪枝稳定性复杂度
- 面向语义的精简化多关系频繁模式发现方法被引量:2
- 2008年
- 多关系频繁模式发现能够直接从复杂结构化数据中发现涉及多个关系的复杂频繁模式,避免了传统方法的局限。有别于主流基于归纳逻辑程序设计技术的方法,提出了基于合取查询包含关系的面向语义的精简化多关系频繁模式发现方法,具有理论与技术基础的新颖性,解决了两种语义冗余问题。实验表明,该方法在可理解性、功能、效率以及可扩展性方面具有优势。
- 杨炳儒张伟钱榕
- 关键词:多关系数据挖掘
- 基于索引数组和复合频繁模式树的频繁闭项集挖掘算法被引量:1
- 2007年
- 频繁闭项集惟一确定频繁项集且规模小得多。CROP是一种基于复合频繁模式树的、频繁闭项集高效挖掘算法,但存在着候选结点过多的问题。这些非闭合结点的生成、检查和剪裁带来了大量不必要的操作。提出了一种改进的频繁闭项集挖掘算法CROP_Index。该算法用"索引数组"来组织数据,找到频繁共同出现的项集。基于二进制位图,给出了一个包含索引的计算方法,并利用索引启发信息合并,得到复合型频繁模式树的初始结点;同时给出一些新的性质,使得改进的算法只生成闭合结点,从而节省了大量不必要的操作,缩小了搜索空间。实验结果表明该算法效率较高。
- 宋威杨炳儒徐章艳张桃红
- 关键词:数据挖掘关联规则频繁闭项集索引数组
- 基于周期采样的数据流频繁项集挖掘算法研究
- 2009年
- 针对用于数据流频繁项集挖掘的现有方法存在引入过多次频繁项集以及时空性能与输出精度较低的问题,利用Chebyshev不等式,构造了项集频度周期采样的概率误差边界,给出了动态检测项集支持度变化方法。提出了一种基于周期采样的数据流频繁项集挖掘算法FI-PS,该算法通过跟踪项集支持度变化确定项集支持度的稳定性,并以此作为调整窗口大小以及采样周期的依据,从而以一个较大的概率保证项集支持度误差有上界。理论分析及实验证明该算法有效,在保证挖掘结果准确度相对较好的条件下,可获得较优执行性能。
- 侯伟杨炳儒吴晨生周谆
- 关键词:数据挖掘数据流
- 差别矩阵属性约简的信息观解释被引量:6
- 2007年
- 常见的属性约简定义有三种,即基于代数观的属性约简,基于信息观的属性约简和基于HU差别矩阵的属性约简。已有文献证明这三种属性约简彼此之间不等价。王国胤教授定义了一种新的决策表信息熵计算方法,在此方法基础上给出了粗糙集理论代数观的一种新的信息观解释。最近有学者提出了一种基于新信息熵的属性约简。经深入研究,我们证明了该属性约简与基于HU差别矩阵的属性约简是等价的,从而给出了基于HU差别矩阵的属性约简的信息观解释。
- 徐章艳杨炳儒宋威侯伟
- 关键词:正区域差别矩阵信息熵
- 一个基于正区域的快速求核算法被引量:17
- 2006年
- 现有利用差别矩阵设计的基于正区域的求核算法,其时间复杂度为O(|C‖U|2)。为降低求核算法的时间复杂度,给出了简化差别矩阵的定义和基于简化差别矩阵核的定义,并证明了该核与基于正区域的核是等价的。由于求简化差别矩阵的关键是求划分U/C,故利用基数排序的思想设计了一个快速求划分U/C的算法,其时间复杂度为O(|C‖U|)。在此基础上,利用简化差别矩阵设计了一个基于正区域的快速求核算法,其时间复杂度降为max{O(|C‖U|),O(|C‖U/C‖Up′os)}。实例说明了新算法的有效性。
- 徐章艳杨炳儒蔡卫东崔巍谷冬元
- 关键词:粗糙集正区域简化差别矩阵复杂度
- 基于主题的个性化元搜索引擎的设计与实现被引量:12
- 2005年
- 介绍了基于主题的个性化元搜索引擎的设计方法与实现技术,该系统可以让用户根据感兴趣的领域自行定制一个主题树,每个主题可以包括多个搜索策略,然后采用元搜索引擎技术使用户能够得到真正想要的信息。
- 王敏杨炳儒
- 关键词:主题树搜索引擎元搜索引擎个性化服务
- 平面点集凸壳的一种快速算法被引量:14
- 2006年
- 提出一种计算平面点集凸壳的快速算法———八方向极值快速凸壳算法。该算法首先对平面点集进行一次扫描,从而快速查找到东、南、西、北、东南、西南、东北、西北8个方向上的极值点,构造出一个更接近凸壳的初始凸壳,从而在后续的点集扫描中可以排除更多的内点,使该算法计算效率更高。该算法的空间复杂度为O(N);其时间复杂度虽然无法突破最坏情况下O(NlogN)的理论下限,但其期望时间复杂度已达到线性水平,并且可以容易地扩展到三维和高维空间。
- 樊广佺马丽平杨炳儒
- 关键词:JAVA凸壳
- 语言场理论及其在知识发现中的应用被引量:4
- 2005年
- 提出了基于认知物理学的语言场理论,给出其基本定义和定理;引入势函数等概念、公式,并把它们分别应用到知识发现的连续属性离散化、聚类两个方面,用以研究解决复杂信息的表示和处理问题。
- 杨炳儒钱榕张伟
- 关键词:知识发现
- 基于软件体系结构的对象持久层设计方案被引量:5
- 2008年
- 针对ScottAmbler提出的健壮持久层设计方案存在的问题,提出了一种基于软件体系结构的对象持久层设计方案。将体系结构作为对象持久层的整体视图,反映了对象持久层的整体功能和结构,并利用层模式实现了对象持久层的可再用性、可维护性、可修改性和可移植性等质量属性。作为设计方案的应用,给出了一种对象持久层的类设计模型。
- 秦奕青杨炳儒李健
- 关键词:对象持久层软件体系结构类设计