陈鑫卿
- 作品数:6 被引量:59H指数:4
- 供职机构:山西大学计算机科学系更多>>
- 发文基金:山西省自然科学基金山西省回国留学人员科研经费资助项目更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 基于互联网的中文问答系统被引量:22
- 2003年
- 搜索引擎(如Google等)返回的是与用户查询相关的文档集,并不是所提出的问题的答案。该文提出了一个基于互联网的中文问答系统,用来增强已有的搜索引擎的功能,使它们能够支持自然语言的回答。
- 张永奎赵辄谦白丽君陈鑫卿
- 关键词:问答系统搜索引擎
- 协作过滤研究概述被引量:23
- 2002年
- 协作过滤分析用户兴趣 ,在用户群中找到指定用户的相似 (兴趣 )用户 ,综合这些相似用户对某一信息的评价 ,形成系统对该指定用户对此信息的喜好程度的预测。其协作过滤具有推荐新信息的能力等多种优点 ,介绍了其现状与发展趋势。
- 白丽君张永奎陈鑫卿
- 关键词:INTERNET信息资源文本过滤信息过滤信息检索
- 基于机器学习的网页主题词自动抽取被引量:7
- 2003年
- 主题词在信息处理和信息检索过程中有广泛的用途 ,然而大量网页没有主题词 ,手工抽取主题词是一个繁重的过程。可以将主题词自动抽取看作是分类问题 ,充分利用网页的结构信息并且使用有监督的机器学习方法来自动地抽取网页中的主题词。
- 张永奎赵辄谦陈鑫卿白丽君
- 关键词:网页自动抽取贝叶斯算法信息处理信息检索计算机网络
- 一种协调的科技文献分类方法被引量:3
- 2003年
- 科技文献之间的相互引证关系反映了一种科学交流活动,显示了科学文献之间(甚至是学科之间)的内在联系,而通过追溯文献之间的这种关系,可以改善和提高传统的基于内容的科技文献的分类的方法。论文利用有相互引证关系,有同引关系,以及有耦合关系的两篇文献一般是属于同一类的这一特点,提出了文献之间的引用相似度,同引相似度,耦合相似度这三个概念,再利用这三个概念生成了文献之间的“结构相似度”,并将它用于K-NN分类法中得出一种基于结构的分类法。最后,论文将这种基于结构的分类法和基于内容的NaveBayes分类法结合起来提出了一种新的协调分类法。
- 陈鑫卿张永奎李荣陆
- 引文信息在科技文献检索中的应用被引量:4
- 2003年
- 科技文献之间的相互引证关系反映了一种科学交流活动,显示了科学文献之间(甚至是学科之间)的内在联系,而通过追溯文献之间的这种关系,可以改善传统的基于内容的科技文献检索的方法.本文应用一篇文章的被引用信息提出了文献的"重要性"的概念,并将它应用到基于内容的检索结果的排序中.
- 陈鑫卿张永奎白丽君赵辄谦
- 关键词:引文信息
- 搜索引擎技术中的Web结构挖掘算法研究
- 今天,人们寻找WWW上的信息,通常是在搜索引擎上执行一个查询.很多搜索引擎是基于关键词的,对于每一个查询,他们返回一个与查询内容匹配的Web网页的序列.对于宽话题查询,这样的搜索引擎经常得到一个较大的含有相关文档的集合,...
- 陈鑫卿
- 关键词:WEB挖掘WEB结构挖掘搜索引擎查询匹配
- 文献传递