王继成 作品数:36 被引量:1,738 H指数:19 供职机构: 南京大学 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 “九五”国家科技攻关计划 更多>> 相关领域: 自动化与计算机技术 文化科学 电子电信 更多>>
信息过滤技术研究 随着web的普及,信息过滤技术得到越来越广泛的应用。本文介绍了基于内容和基于协作的两种不同的过滤方法;描述了信息过滤中的关键技术,包括用户兴趣文件的表示、建立、维护和相似度比较。 毛颖 周源远 王继成关键词:信息过滤 文献传递 网络信息服务系统Computer-NIS的设计与实现 被引量:5 2000年 本文描述一个网络信息服务系统原型Commputer NIS ,讨论了系统的设计目标 ,系统的体系结构 ,包括数据模型、Web信息检索、基于Z39 50的书目检索以及Z39 50 Web网关。Com puter NIS可以用于情报收集与分析、网上教学等多种应用 ,有效地提高了信息获取的质量和效率。 王继成 邹涛 杨小江 张福炎关键词:信息服务 信息检索 WEB 网络信息服务系统 一种两阶段的神经网络属性选择方法 被引量:3 2003年 神经网络的输入属性选择一直是一个比较困难的问题.由于神经网络反复训练的时间复杂度,Wrap-per方法是不适用的,而单纯使用Filter方法也难以获得很好的分类精度.文中提出了一种两阶段的神经网络属性选择方法,以综合Filter和Wrapper两类方法的优势.该方法首先采用基于不一致率的遗传算法GFSIC来删除属性集合中的无关属性,然后采用基于敏感性度量的属性选择算法SBFCV来删除冗余和无用的属性.研究和实验结果表明,该方法可以有效地删除原始数据中的无关和冗余属性,增强神经网络的泛化能力. 王继成 黄源 武港山 张福炎关键词:神经网络 遗传算法 Web文档清洗技术 被引量:9 2002年 1引言
随着Internet在全球的迅速发展,WWW(World WideWeb)已经发展成为一个包含多种信息资源、站点遍布全球的巨大信息服务网络,为用户提供了一个极具价值的信息源,并已成为世界范围内信息共享和信息传播的最主要渠道之一.WWW系统一经出现,就得到了迅猛的发展,无论是WWW站点数还是WWW用户数,都是以每年5~10倍的速度呈指数形式增长.目前仅中国的Internet用户就已经达到了2500万. 张波 王继成 王强 张福炎关键词:WWW 信息资源 信息挖掘 信息检索 中文文档自动分类系统的设计与实现 被引量:85 1999年 文档自动分类是信息处理领域中的一项重要研究课题。本文阐述了一个中文文档自动分类系统的设计与实现,并着重介绍了系统实现中的一些主要技术问题的处理,如文本分类模型、特征提取、词典构造等。 邹涛 王继成 黄源 张福炎关键词:VSM 特征提取 中文文档 文档分类 自动分类系统 支持向量机理论综述 被引量:101 2000年 1 引言随着信息技术的发展,人类积累的数据量呈几何级数递增。如何从这些数据中发掘出有效的信息而不被信息海洋所淹没已经成为迫在眉睫的问题。对数据挖掘相关领域的研究,例如数据分类、聚类,函数模拟和规则抽取等技术,逐渐成为当前计算机基础技术研究的重心之一。支持向量机(Support Vector Machine,SVM)方法作为一种解决多维函数预测的通用工具, 萧嵘 王继成 张福炎关键词:支持向量机理论 模式识别 计算机 一个面向对象的客户/服务器应用编程接口 被引量:4 2002年 本文介绍了一个以基本类库形式提供的客户/服务器应用编程接口IDUCOM。在IDUCOM中,我们构造了一个通信模型,并采用面向对象的技术加以设计和实现。IDUCOM既简化了客户/服务器应用的开发,又提高了应用对平台的独立性。 王继成 孙颖 萧嵘 张福炎关键词:面向对象 应用编程接口 通信协议 一种SVM增量学习算法 被引量:41 2002年 分析了SVM理论中SV(支持向量 )集的特点 ,给出一种SVM增量学习算法 .通过在增量学习中使用SV集与训练样本集的分类等价性 ,使得新的增量训练无需在整个训练样本空间进行 .理论分析和实验结果表明 。 萧嵘 王继成 孙正兴 张福炎关键词:支持向量机 训练样本集 一种多值返回的层次化分类方法 2003年 随着Internet上信息量的飞速增长,成千上万的网上文档需要分类以方便用户的浏览和获取。因此文档的自动分类工作已经越来越受到重视,一些相应的分类方法也应运而生。但其中很少有涉及到"层次化"的分类领域,且绝大多数方法仅仅返回单个分类结果。文中,我们提出了一种新的文档自动分类方法:MRHC(Multicategory ReturnedAlgorithmforHierarchicalClassification)。该方法着眼于层次化的分类技术,并在适当的情况下为文档返回多个分类结果。该方法中结合了特征削减和增量学习技术以便提高分类性能。最后,为了更加准确、客观的评价分类结果,提出了一种新的评估方法:LEP(Length of Error Path)。实验结果表明,提出的分类方法响应时间短,分类准确度高,具有较强的实用性。 周源远 王继成 郑刚 张福炎Web文本挖掘技术研究 被引量:523 2000年 作为从浩瀚的 Web信息资源中发现潜在的、有价值知识的一种有效技术 ,Web挖掘正悄然兴起 ,倍受关注 .目前 ,Web挖掘的研究正处于发展阶段 ,尚无统一的结论 ,需要国内外学者在理论上开展更多的讨论 .同时 ,Web挖掘系统的开发对其研究也将起到很大推进作用 .首先探讨了 Web挖掘的有关理论 ,从 Web挖掘的定义、Web挖掘与 Web信息检索的关系、Web挖掘任务的分类与功能等方面加以阐述 .然后重点分析了 Web文本挖掘的方法 ,包括 :文本的特征表示、文本分类与文本聚类 .在此基础上简单介绍了一个 Web文本挖掘系统原型Web Miner.Web Miner采用了多 agent体系结构 ,将多维文本分析与文本挖掘这两种技术有机地结合起来 ,以帮助用户快速、有效地挖掘 Web上的 HTML 文档 . 王继成 潘金贵 张福炎关键词:文本挖掘 文本分类 文本聚类 信息检索 WEB