您的位置: 专家智库 > >

周源远

作品数:12 被引量:188H指数:7
供职机构:南京大学计算机科学与技术系计算机软件新技术国家重点实验室更多>>
发文基金:国家自然科学基金国家高技术研究发展计划国家科技重大专项更多>>
相关领域:自动化与计算机技术文化科学更多>>

文献类型

  • 10篇期刊文章
  • 1篇学位论文
  • 1篇会议论文

领域

  • 11篇自动化与计算...
  • 2篇文化科学

主题

  • 4篇信息检索
  • 3篇信息过滤
  • 3篇页面
  • 3篇WEB页
  • 3篇WEB页面
  • 2篇信息抽取
  • 2篇信息块
  • 2篇聚类
  • 2篇包装器
  • 2篇抽取
  • 2篇抽取规则
  • 1篇多协议
  • 1篇多协议标签交...
  • 1篇信息处理
  • 1篇信息处理系统
  • 1篇信息管理
  • 1篇信息过滤系统
  • 1篇信息集成
  • 1篇引擎
  • 1篇搜索

机构

  • 11篇南京大学
  • 1篇江苏大学

作者

  • 12篇周源远
  • 8篇王继成
  • 6篇张福炎
  • 3篇袁春风
  • 3篇郑刚
  • 3篇毛颖
  • 2篇王庆一
  • 2篇武港山
  • 1篇宋顺林
  • 1篇陈继明
  • 1篇陈晓辉

传媒

  • 4篇计算机应用研...
  • 3篇计算机工程
  • 1篇计算机研究与...
  • 1篇情报学报
  • 1篇计算机科学

年份

  • 1篇2006
  • 1篇2005
  • 7篇2003
  • 3篇2002
12 条 记 录,以下是 1-10
排序方式:
一种多值返回的层次化分类方法
2003年
随着Internet上信息量的飞速增长,成千上万的网上文档需要分类以方便用户的浏览和获取。因此文档的自动分类工作已经越来越受到重视,一些相应的分类方法也应运而生。但其中很少有涉及到"层次化"的分类领域,且绝大多数方法仅仅返回单个分类结果。文中,我们提出了一种新的文档自动分类方法:MRHC(Multicategory ReturnedAlgorithmforHierarchicalClassification)。该方法着眼于层次化的分类技术,并在适当的情况下为文档返回多个分类结果。该方法中结合了特征削减和增量学习技术以便提高分类性能。最后,为了更加准确、客观的评价分类结果,提出了一种新的评估方法:LEP(Length of Error Path)。实验结果表明,提出的分类方法响应时间短,分类准确度高,具有较强的实用性。
周源远王继成郑刚张福炎
PAC:一种结合了分割和凝聚技术的聚类方法
2005年
文档的自动聚类技术被普遍认为是一种行之有效的网上信息资源管理方法。目前主要存在两种类型的聚类方法:分割型和凝聚型,它们在计算复杂度和聚类效果上各有千秋。该文提出了一种结合了这两种聚类技术的聚类法:PAC。实验结果表明,PAC具有较低的计算复杂度,且聚类结果优于传统的分割型和凝聚型方法。
陈继明周源远宋顺林
关键词:聚类
信息过滤技术研究
随着web的普及,信息过滤技术得到越来越广泛的应用。本文介绍了基于内容和基于协作的两种不同的过滤方法;描述了信息过滤中的关键技术,包括用户兴趣文件的表示、建立、维护和相似度比较。
毛颖周源远王继成
关键词:信息过滤
文献传递
Web页面清洗技术的研究与实现被引量:28
2002年
文章提出了Web页面清洗的概念,给出了一种基于规则的Web页面清洗方案,并实现了基于此方案的系统。文中的页面清洗建立在Web页面的DOM树结构上,并通过人工判定的方法进行了实验和评估。实验结果表明该方案切实可行、清洗方法具有较快的速度和准确性。
周源远王继成郑刚张福炎
关键词:WEB页面清洗技术文本块DOM解析器信息检索
信息过滤技术研究被引量:19
2003年
As the rapidly growing information on Web, information filtering techniques have been more and morewidely used. This paper introduces two main filtering methods ,named content-based and collaborative filtering; con-trastively describes the key techniques in information filtering,including the representation,creation and rebuilding ofuser profile ,and similarity computing.
毛颖周源远王继成张福炎
关键词:信息过滤搜索引擎信息检索互联网
多信息块Web页面的信息抽取被引量:36
2002年
提出了一个采用新的抽取规则的包装器 ,结合采用基于文档结构抽取规则和基于特征Pattern匹配抽取规则包装器的优点 ,可以适用于含有多个信息块的Web页面。
王庆一王继成周源远袁春风
关键词:WEB页面信息抽取包装器抽取规则
多信息块Web页面中的抽取规则被引量:18
2003年
以往的包装器主要针对仅含有一个数据块的Web页面,而对含有多个信息块的Web页面,简称MIB(Multiple Information Block), Web页面无法处理。该文提出了一个新的抽取规则,结合了基于文档结构的抽取规则和基于特征Pattern匹配的抽取规则的优点,能够有效地抽取MIB Web页面中的信息。
王庆一王继成周源远袁春风
关键词:信息抽取包装器抽取规则信息集成
一种集成IPSec和MPLS技术的VPN方案被引量:8
2003年
从VPN的需求出发,探讨了IPSecVPN和MPLSVPN各自的优点、局限性以及它们的适用场合,提出了一种基于IPSec和MPLS技术的VPN解决方案,以获得对VPN需求更全面的支持。
郑刚周源远张福炎
关键词:IPSECMPLSVPNINTRANET多协议标签交换
一种篇章结构指导的中文Web文档自动摘要方法被引量:68
2003年
“摘要”、“关键词”是对文档内容提供简要概括的元数据 ,在Web信息检索中起着重要作用 针对Web信息检索的需求和Web文档的特点 ,采用拟人思维 ,提出了一种以篇章结构为指导的自动摘要方法 该方法对段落之间的内容语义关系进行分析 ,进而划分出文档的主题层次 ,得到文档的篇章结构 ;在篇章结构的指导下 ,使用统计方法和启发式规则来提取文档的关键词、关键句 ,生成文档的摘要 在实验评估中 。
王继成武港山周源远张福炎
关键词:篇章结构WEB信息检索
一个基于反馈的信息过滤系统的设计与实现被引量:11
2003年
随着互联网上信息的迅速增长,信息过滤技术得到越来越广泛的应用.本文论述了一个基于反馈的内容信息过滤系统的设计和实现.它采用向量空间模型,使用类重心分类算法来形成用户兴趣文件,采用余弦算法比较待过滤文档和用户兴趣文件的相似度,并使用Rocchio反馈模型来重建用户兴趣文件.实验表明,本文提出的策略和方法是切实可行的.
毛颖王继成周源远张福炎
关键词:信息过滤系统网络信息管理ROCCHIO向量模型
共2页<12>
聚类工具0