董微
- 作品数:5 被引量:20H指数:3
- 供职机构:中国科学技术信息研究所更多>>
- 发文基金:国家社会科学基金更多>>
- 相关领域:文化科学自动化与计算机技术更多>>
- 基于密度分布单类支持向量机的科技文献分类研究被引量:2
- 2018年
- 在OCSVM单分类问题上,科技文献自动分类时交叉学科的分类并未得到良好的解决,且支持向量构造的超平面未考虑到非支持向量的影响,本文提出了一种基于密度分类的单类支持向量机的分类算法,将支持向量的密度分布引入目标函数。实验结果表明,该算法能够较好的将交叉学科的科技文献进行主题分类。
- 董微赵捷
- 关键词:单类支持向量机
- 开放学术资源元数据质量管理研究
- 开放学术资源已成为数字图书馆的重要资源,对开放资源元数据进行质量管理成为开放资源建设的重要内容.本文分析了在开放资源建设过程中,影响开放学术资源元数据质量的因素,并对开放资源元数据质量管理进行研究与探索,构建了开放学术资...
- 董微赵捷
- 关键词:数字图书馆元数据质量管理
- 面向发现服务的图书馆元数据集成管理系统构建研究被引量:12
- 2018年
- 元数据集成管理系统是图书馆发现系统的重要组成之一。为构建该系统,本文对面向发现的元数据集成管理研究现状进行调研与总结。针对发现服务面临的主要数据问题,提出在元数据集成管理过程中,采用基于异构数据同构化、元数据统一规范、查重归并与语义冲突处理方法的解决方案。在此基础上,对系统构建需求进行分析并给出系统信息架构、集成管理流程、系统功能的设计。基于相关设计,提出一种基于领域驱动设计的系统实现方法。
- 赵捷董微
- 关键词:图书馆系统
- 面向学术资源集成的真值发现算法被引量:3
- 2017年
- 在构建多渠道元数据资源建设体系时,往往存在着大量的元数据冲突的问题,即对同一对象的属性存在多种描述,造成了元数据的组织与揭示的困难。本文处理的原则是遵从原文,优先选取原文的值作为唯一的真值,将数据冲突问题视为单真值冲突问题。考虑到数据提供商均需要加工数据,将数据源之间的关系视为相互独立。根据以上,本文提出了一种面向学术资源集成的真值发现算法。该算法基于贝叶斯算法,考虑了有关联关系的属性。实验证明本文方法所构造的真值发现算法在保证准确率的同时,大大节省了人力的工作时间。
- 董微杨代庆
- 关键词:资源建设元数据集成
- 开放期刊资源元数据质量管理研究被引量:4
- 2018年
- 开放期刊资源已成为数字图书馆的重要资源,对开放期刊资源元数据进行质量管理成为开放期刊资源建设的重要内容。在总结开放期刊资源特点的基础上,分析在开放期刊资源建设过程中影响开放期刊资源元数据质量的因素,并对开放期刊资源元数据质量管理进行研究与探索,构建开放期刊资源元数据质量的管理模型,最后提出开放期刊资源元数据质量管理流程。
- 董微赵捷
- 关键词:元数据数据质量质量管理