您的位置: 专家智库 > >

国家自然科学基金(70903008)

作品数:4 被引量:9H指数:2
相关作者:罗鹏程陈翀刘晓兵陆炀李峰更多>>
相关机构:北京师范大学北京大学更多>>
发文基金:国家自然科学基金国家科技支撑计划中央高校基本科研业务费专项资金更多>>
相关领域:文化科学自动化与计算机技术更多>>

文献类型

  • 4篇期刊文章
  • 1篇会议论文

领域

  • 3篇自动化与计算...
  • 2篇文化科学

主题

  • 2篇大众
  • 2篇大众分类
  • 1篇信息构建
  • 1篇信息检索
  • 1篇社会标注
  • 1篇资源组织
  • 1篇网络
  • 1篇网络资源
  • 1篇目录树
  • 1篇ALGORI...
  • 1篇CONSTR...
  • 1篇ENHANC...
  • 1篇标签
  • 1篇层次式
  • 1篇抽取
  • 1篇答案抽取
  • 1篇AN

机构

  • 4篇北京师范大学
  • 3篇北京大学

作者

  • 3篇陈翀
  • 2篇何靖
  • 2篇罗鹏程
  • 1篇闫宏飞
  • 1篇陆炀
  • 1篇毛先领
  • 1篇刘晓兵
  • 1篇李峰

传媒

  • 1篇中国图书馆学...
  • 1篇图书情报工作
  • 1篇广西师范大学...
  • 1篇Journa...

年份

  • 1篇2017
  • 1篇2013
  • 1篇2012
  • 2篇2010
4 条 记 录,以下是 1-5
排序方式:
从大众分类到层次式资源组织体系——利用聚类信息构建标签树被引量:5
2013年
提出一种合理运用大众标注数据自动构建资源导航体系的方法,首先使用聚类技术将标签分成主题相近的簇,然后在簇内按标签的泛指度和相似性构造标签树。将该方法用在公开的标签数据集SocialODP-2k9上进行实效评价,结果表明,本方法减少了以往标签树构造方法中"意义漂移"的缺陷,使组织结构有更好的语义一致性,且具有更好的导航效率,从而使本研究能适应信息组织与服务的实际需要。
罗鹏程陈翀
关键词:社会标注资源组织
网络资源层次组织规律定量研究被引量:3
2012年
本文以互联网FTP目录树为对象,从大众构造的层次式结构中揭示管理网络资源时的组织规律。通过考察44,972个软件资源及其在目录树中的位置,得到如下认识:①对于用户查找、浏览资源来说,资源存放在深度为2或3层较适合。②当要管理的资源数量在200以内时,人们可容忍平均1个目录中包含10个左右的软件资源;当资源数量更大时,人们可容忍平均1个目录中包含15个左右的软件资源。③在使用层次式组织结构时,人们会对结构的深度有一个习惯上限,目录结构平均深度一般不多于6层。④人们考虑组织结构时,会在"分类体系复杂度"和"分类精细度"之间权衡,在资源量增多时,尽量保证扁形结构。本文揭示了采用层次方式组织资源时的一些共性,有助于设计更贴近大众习惯的网络资源组织与导航系统,并对标签聚类等从扁平型信息组织方式中提取类目层次的研究工作提供依据。
陈翀罗鹏程刘晓兵陆炀
关键词:网络资源目录树大众分类
Enhancing Navigability:An Algorithm for Constructing Tag Trees被引量:1
2017年
Purpose: This study introduces an algorithm to construct tag trees that can be used as a userfriendly navigation tool for knowledge sharing and retrieval by solving two issues of previous studies, i.e. semantic drift and structural skew.Design/methodology/approach: Inspired by the generality based methods, this study builds tag trees from a co-occurrence tag network and uses the h-degree as a node generality metric. The proposed algorithm is characterized by the following four features:(1) the ancestors should be more representative than the descendants,(2) the semantic meaning along the ancestor-descendant paths needs to be coherent,(3) the children of one parent are collectively exhaustive and mutually exclusive in describing their parent, and(4) tags are roughly evenly distributed to their upper-level parents to avoid structural skew. Findings: The proposed algorithm has been compared with a well-established solution Heymann Tag Tree(HTT). The experimental results using a social tag dataset showed that the proposed algorithm with its default condition outperformed HTT in precision based on Open Directory Project(ODP) classification. It has been verified that h-degree can be applied as a better node generality metric compared with degree centrality.Research limitations: A thorough investigation into the evaluation methodology is needed, including user studies and a set of metrics for evaluating semantic coherence and navigation performance.Practical implications: The algorithm will benefit the use of digital resources by generating a flexible domain knowledge structure that is easy to navigate. It could be used to manage multiple resource collections even without social annotations since tags can be keywords created by authors or experts, as well as automatically extracted from text.Originality/value: Few previous studies paid attention to the issue of whether the tagging systems are easy to navigate for users. The contributions of this study are twofold:(1) an algorithm was developed to construct tag trees wit
Chong ChenPengcheng Luo
关键词:ALGORITHM
开放域问答系统研究综述
尽管搜索引擎能够满足网络用户的很多信息需求,但是还有很多它无法满足。原因之一是它严格的用户界面:它的输入是关键词,它的输出是相关文档集。对于很多信息需求,更加合适的提问和回答方式是自然语言。开放域问答系统就是用于解决这一...
何靖陈翀闫宏飞
关键词:信息检索答案抽取
文献传递
文献检索与基于影响的摘要系统设计与实现被引量:1
2010年
构建了一种新型文献检索系统,能够摘要一篇文献中引起读者研究工作关注的那些内容,并返回读者对这些内容的评论,从而帮助用户快速了解该文献的学术价值及不足之处等重要信息。利用文献间的引用关系从其他文献中找到指向一篇文献的评论上下文,借鉴查询-检索模式,将评论转化为一元语言模型所生成的查询,并将原文献划分为句子所构成的文档集,基于KL-divergence检索模型找到原文献中与评论对应的句子。选取得分最高的若干句子构成体现原文献对外影响的摘要。系统基于北京大学研制的智能搜索引擎平台Platform for Applying,Researching And Developing Intelligent Search Engine(PARADISE),具有快速构建可扩展好的优点。
陈羽中李峰毛先领何靖闫宏飞
共1页<1>
聚类工具0