张剡
- 作品数:34 被引量:42H指数:4
- 供职机构:南京大学更多>>
- 发文基金:国家高技术研究发展计划国家自然科学基金教育部“新世纪优秀人才支持计划”更多>>
- 相关领域:自动化与计算机技术更多>>
- SSXCS:半监督学习分类系统被引量:7
- 2013年
- 学习分类系统作为一种自适应的机器学习技术,已经被成功地运用于解决多种学习问题.传统的学习分类系统的工作主要关注监督学习(分类)和无监督学习(聚类)环境下的研究,而学习分类系统在半监督学习环境下的效果不得而知.因此提出一种新的半监督学习分类系统(SSXCS),目的是研究学习分类系统是否能够在已知少量的已标记数据的情况下利用大量的未标记数据来提高学习性能.SSXCS先通过更新与进化得到对应的已标记规则集与无标记规则集,然后利用新提出的规则标记算法对无标记规则集进行标记,约简规则后生成最终的分类系统.实验结果表明,SSXCS能够有效地利用提供的无标记数据来提高分类器性能,同时相比较于一般的半监督学习算法,SSXCS能够取得更好或者相当的分类性能.
- 俞亚君霍静史颖欢高阳张剡
- 关键词:半监督学习
- 一种大域数据流中缺失值的填充方法被引量:4
- 2011年
- 在网络流量监控等数据流应用场景中,数据流中的IP地址等属性的值域往往很大,对于连续到达的数据流,管理系统一般不存储全体数据集,而是维护一个较小规模的数据概要.对于这类大域数据流中的缺失数据,难以采用邻近值填充等传统方法进行填充,也不能轻易删除.最小计数概要是一种轻量级的数据流概要,适合大域数据流的概要维护.本文基于最小计数概要及其维护技术,提出最小频率概要,并根据这两种概要填充大域数据流中的缺失数据.该填充方法首先设计一组两两独立的Hash函数族,将一段时间内大域数据流的属性值(如网络流量)映射并累加到非大域二维表数据结构中,形成大域数据流的计数概要(如一段时间内网络总流量),与此同时,在二维表中存储计数概要伴随的频率概要(即数据流到达次数,如数据包的个数),然后根据最小计数概要与最小频率概要之比对大域数据流的缺失值(如某个数据包的流量)进行填充.采用模拟大域数据集在通用软硬件环境下进行大量实验,结果表明,基于最小计数/频率概要的填充方法可获得较高的精度,而且填充误差随数据属性值定义域的变化呈非单调性变化,另外,随着数据量的增加,填充误差虽然越来越大,但是变化越来越缓慢,最终趋于一个稳定值.对于给定误差参数ε,本文设计的填充算法时空界限为1/ε,部分应用的时间界限为1.
- 赵飞刘奇志张剡柏文阳
- 关键词:不确定性缺失值填充
- 一种CCMI文本特征选择方法
- 本发明公开了一种CCMI文本特征选择方法,从预处理过后的语料库中提取所有的特征,构成原始特征集合F;选择改进的χ<Sup>2</Sup>统计(IPX2)和改进的互信息(IPMI)并将二者联合作为评估函数,对原始特征集合F...
- 柏文阳吴海涛张剡周嵩
- 文献传递
- 数据库安全模型的研究
- 在现有安全模型的基础上提出了NDMAC模型。该模型对主客体进行了明确的定义和分类,并采用最细客体粒度为属性和元组级的方案。该模型提出了隶属完整性规则、实体完整性规则和推理完整型规则,并给出了六种操作的处理策略。此外模型引...
- 张剡夏辉柏文阳
- 关键词:数据库安全强制访问控制多级安全模型
- 文献传递
- 网格环境下清空型调度策略应用研究
- 2005年
- 在网格计算中,资源的调度优化特别是请求的调度优化是一个关键技术问题,引入离散事件动态系统中的水箱型混合动态系统模型,对网格上的资源和请求进行一体化建模。清空型调度策略是混合动态系统中一类重要的调度策略,研究了它在网格环境下的应用性能,提出一种推广形式。重点研究系统模型的建立和调度策略的稳定性分析,给出稳定性证明的理论推导过程和仿真实验结果。为下一代网络中的数据管理提供了一种新思路。
- 刘奇志张剡毛奇正
- 关键词:网格计算
- 数据库安全模型NDMAC的设计及应用被引量:4
- 2005年
- 系统地描述了适用于增强型安全数据库的通用安全模型NDMAC的设计及应用。该模型参考了Bell LaPadula,Jajodia Sandhu等经典安全模型,充分考虑增强方式数据库安全的特点以及传统安全模型在实用中遇到的问题,对经典模型进行改进,使模型兼备安全性和实用性,并介绍了NDMAC模型软件系统。
- 夏辉柏文阳汪星樊征张剡
- 关键词:数据库安全强制访问控制多级安全模型
- “汇事通”自动平盘决策支持系统的设计与实现被引量:1
- 2005年
- 个人外汇买卖是银行的一种业务,在进行外汇交易过程中选择合理的获利平盘时机是非常关键的一步,它和多种不确定因素相关。目前的平盘决策完全凭交易员的经验来决定,为了避免平盘决策中的盲目性,开发了自动平盘决策支持系统,目的是科学地规避汇市中高风险的同时获得最大的利润。
- 唐蕾张剡徐洁磐
- 关键词:决策支持系统汇市
- 关系数据库管理系统CBase V 1.0及其应用
- 柏文阳徐洁磐毛宇光张剡唐蕾刘奇志何瑗刘玲蒋明肖建华许俊伯周洪昊符江东黄松英
- 该项目是南京大学自主开发项目,其目的是在我单位原有的研究成果“面向对象数据库管理系统OMNIX”的基础上,参照国内外的主海参关系数据库管理系统,研制并实现一个具有自主版权的关系数据库管理系统,并成为实用化与初步商品化的产...
- 关键词:
- 关键词:关系数据库数据安全
- 基于用户偏好的不确定数据阈值轮廓查询算法
- 不确定数据轮廓查询的研究主要是在假设每一维的属性都有确定的全序关系上进行的.在现实的应用中会出现属性的属性值优先级是不确定的,需要根据用户的偏好来定义属性值之间的优先级次序。而现有的不确定数据轮廓查询算法并不适用。先通过...
- 艾文凯张剡柏文阳
- 关键词:不确定性数据
- 一种适用于法律识别的层次多标签分类方法
- 本发明公开了一种适用于法律识别的层次多标签分类方法,包括以下步骤:步骤1,从经过预处理的裁判文书中提取案件事实及其法律条文;步骤2,基于标签空间的层次结构,扩展案件事实对应的法律条文,使案件样本的类别标签为标签空间的一个...
- 柏文阳陈朋薇张剡周嵩
- 文献传递