曾文 作品数:84 被引量:388 H指数:12 供职机构: 中国科学技术信息研究所 更多>> 发文基金: 国家社会科学基金 国家自然科学基金 国家科技支撑计划 更多>> 相关领域: 文化科学 自动化与计算机技术 经济管理 社会学 更多>>
基于深度学习技术的海量科技文献向量表示方法研究 随着大数据时代的到来及信息技术的不断发展,为了解决从大量科技文献数据中学习到高级抽象特征的问题,需要引入深度学习技术,即引进深度学习技术为科技文献大数据的处理和分析提供一个新的契机,科技文献是科技大数据的重要数据内容之一... 曾文 李辉 徐红姣 袁芳 李智杰关键词:科技词语 向量表示 一种基于知识树的科技前沿探测方法——以深度学习领域为例 被引量:3 2024年 [目的/意义]当前全球科技竞争愈加剧烈,准确把握未来科技前沿是科技竞争取得胜利的关键,科技前沿探测是科技情报研究的热点问题之一。[方法/过程]文章提出一种基于知识树的科技前沿探测方法,通过科技前沿知识树反映领域科技前沿的发展信息,探索解决科技前沿探测过程中存在的信息冗余、探测结果不准确等问题的方法和途径,并以深度学习领域为例进行了实证研究。[结果/结论]研究结果表明,基于知识树的科技前沿探测方法可以在一定程度上提高科技前沿探测过程的效率,改善科技前沿探测结果的质量,可以为面向特定领域的科技前沿研究提供参考。 曾文 闫甜甜 刘晓琳 张蕾关键词:知识树 科技情报 科技大数据资源平台建设研究 被引量:13 2022年 [目的/意义]随着科学技术的发展,顺应科技管理环境和应用需求构建科技大数据资源管理系统是极其必要的,在技术上也是可行的。[方法/过程]文章在阐述科技大数据的采集和来源基础上,研究科技大数据资源加工标准、科技成果数据资源整合和深度标引、科技大数据资源知识关系的揭示和融合等问题。在此基础上,开发科技大数据资源整合与加工系统,构建科技大数据资源平台,介绍其架构和结构。[结果/结论]科技大数据资源平台将支持技术机会分析、技术预测、技术趋势描绘、技术监测等应用需求。 李辉 曾文 谭晓 赵桂芬 靳晓宏关键词:大数据 资源平台建设 基于多源数据的前沿科学领域与新兴研究方向识别和遴选方法研究 新一轮的科技革命正在兴起,若要在激烈的国际竞争中快速提升科技创新能力,占领前沿技术的制高点,则必须牢牢把握科技进步的方向,掌握科技发展的最新动态,制定战略性的科技发展规划.从浩瀚的科技信息数据中识别和遴选前沿科学领域和新... 曾文 李辉 李荣关键词:多源数据 情报分析 机构知识库的新机遇:替代计量学 被引量:8 2014年 越来越多的大学管理者试图寻找新的方法,通过定量的手段来衡量该校教师、学生和科研人员的学术成果的影响.通过替代计量指标(基于在线活动的补充指标),机构知识库可以改进已有的计量方法,甚至,为图书馆服务带来新的可能. 刘丹 赵宇峰 曾文关键词:知识库 汉语叙词表构建系统 本发明提供了一种汉语叙词表构建系统,其包括输入设备、系统处理器、存储器、输出设备。系统处理器包括数据处理器、叙词识别与抽取器、叙词关系识别与抽取器、叙词表生成器。存储器通信连接于系统处理器的数据处理器、叙词识别与抽取器、... 曾文 乔晓东 朱礼军 张均胜文献传递 数字资源发展前景与知识组织——数字化时代主题词表构建技术的创新性研究 主题词表作为一种传统的信息组织和获取的术语控制工具,在数字化时代仍然具有重要的使用价值,但是要对这一传统的信息组织方法的本质、理论摹础及内容范围,尤其是主题词表构建技术问题进行全面的认识和研究。对以上问题的研究既需要从认... 曾文关键词:数字图书馆 主题词表 多语言 本体构建 科技大数据的情报分析技术研究 被引量:12 2019年 【目的/意义】现代科学技术的进步和发展给情报研究工作,特别是给情报分析技术带来了变化。传统的情报分析技术面对海量数据的快速增长和技术进步的事实,采用新方法和新技术充实到科技情报分析过程中已是必然趋势。【方法/过程】本文以科技大数据为研究和分析对象,论述国内外的相关研究现状,介绍科技大数据的建模和分析流程,阐述科技大数据分析平台的设计和研发工作。【结果/结论】论文通过实例介绍科技数据分析平台的数据分析过程,为实现科技大数据情报分析平台的实用化奠定了研究基础和方法。 曾文 车尧关键词:情报分析 科技政策术语自动识别技术初探 被引量:3 2017年 在对科技政策领域术语的特点分析基础上,提出一种适用于科技政策领域的术语识别方法,即结合科技政策术语的语言特点,采用统计计算的方法进行两次术语过滤过程,实现科技政策术语的自动识别。实验结果表明,本文提出的基于科技政策术语语言特点和统计计算相结合的科技政策术语自动识别的方法具有一定的可行性,将用于科技政策词典的构建和科技政策文本内容的深层次语义分析。 曾文 李智杰 王小玉 董诚关键词:自动识别 科技前沿识别体系中的机器学习应用问题 2023年 当前科技前沿识别研究方法难以得到更细粒度的分析结果,同时传统计量方法已不能够满足对当前来自网络的开源信息的情报挖掘需求,而机器学习方法可以实现数据细粒度的知识挖掘,因此成为解决科技前沿识别问题的重要手段。对2013—2021年中国知网和Web of Science(WoS)数据库收录的机器学习相关文献,在运用文献计量统计方法进行时间分布、研究主题及热点分析基础上,构建包含数据感知与处理层、情报计算和感知层、情报产品刻画层的开源情报环境下的科技前沿识别体系延伸架构,解读机器学习方法在各层次上的应用问题及关联关系,并提出不同层次需求发展的意见和建议;进而以7 944篇从WoS核心期刊库采集到的“深度学习”主题相关文献作为实验对象,主要针对数据处理中的知识单元构建进行论证。实证结果显示:从应用场景来看,多媒体信息处理的主题热度变化不大,智能机器人的主题热度逐年增高;从机器学习任务来看,目标检测和追踪的主题热度逐年降低,特征工程和数据分类则呈增长趋势。案例分析证明了所提出理论框架的科学性。 王力 曾文 张运良 金辉关键词:开源情报 科技情报