衡晓帆
- 作品数:6 被引量:56H指数:4
- 供职机构:北京理工大学管理与经济学院更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划浙江省自然科学基金更多>>
- 相关领域:文化科学自然科学总论社会学经济管理更多>>
- 专利技术主题分析:基于SAO结构的LDA主题模型方法被引量:35
- 2017年
- [目的/意义]改善现有专利技术主题分析方法主题辨识度低、主题词二义性、无法识别技术信息中的"问题"与相应"解决方案"等问题。[方法/过程]本文通过抽取专利文本中的SAO结构,并从SAO结构中识别"问题和解决方案"(P&S)模式,基于"bagofP&S"假设,构建基于"主语-行为-宾语"(subject-action-object,SAO)结构的LDA主题模型,实现对专利文献主题结构的识别和分析。[结果/结论]案例研究表明,该方法能够有效识别主题分布,并在主题辨识度和语义消岐方面较传统LDA模型具有较大优势。
- 杨超朱东华汪雪锋朱福进衡晓帆
- 关键词:石墨烯
- 科学基金资助与“973计划”关联关系分析研究被引量:1
- 2012年
- 选取国家科技部"973计划"2010年度资助项目作为分析对象,通过多维定量分析从人才储备支持、研究领域覆盖和研究思路培育等三个方面深入探讨了科学基金资助与"973计划"间的关联关系。研究表明,科学基金资助在一定程度上对"973计划"具有基础性支撑培育作用。
- 汪雪锋衡晓帆刘长利段庆锋
- 关键词:科学基金
- 基于核心期刊论文的我国情报学合著网络分析被引量:5
- 2014年
- 以自主开发的合著分析可视化软件为工具,以情报学领域中文核心期刊论文为数据源,通过论文来源期刊分析、新增作者及机构分析,高产作者合著及高产机构合著分析,并创造性地引入作者署名顺序,研究表明情报学领域高产作者通常为第二或第三作者,论文合著则主要以师生或同事为主,合著总体匮乏;而高产机构合著则具有明显的地域或系统内部特征,高产机构以第一作者所属机构为主体,情报学领域的合作研究亟待加强,拓展空间广泛。
- 衡晓帆邱鹏君王有国汪雪锋
- 关键词:情报学CNKI
- 基于语法树的SAO结构识别方法研究被引量:5
- 2016年
- [目的/意义]SAO是一种能够表示主题信息和主题间关系的3元组结构,是文献计量学领域一个快速发展的研究方向。为了获得"满足文献计量分析需求的SAO结构",需要解决现有SAO结构识别方法遭遇的3个问题:查全和查准率低、所识别SAO结构和领域主题相关性不强以及矩阵稀疏性。[方法/过程]提出一种面向文献计量分析的基于语法树的SAO结构识别方法,首先基于共现算法和"主题词簇"方法(term clumping)识别SAO核心组件,然后利用基于语法树的抽取算法实现SAO结构的逐层抽取。[结果/结论]案例研究发现,该方法的平均查准率为0.805 8,平均查全率为0.844 6,所识别SAO结构与领域主题关系较强,且矩阵稀疏性也得到较好改善,可有效应用于相关文献计量分析。
- 杨超朱东华衡晓帆汪雪锋
- 关键词:语法树语义分析
- 基于时间序列的关联分析在技术监测中的应用研究被引量:2
- 2013年
- 关联分析与序列分析的目的都是发现数据间的各种相关联系。关联分析用于发现同一时间段内的各种联系,而序列分析用于发现在时间上具有先后关系的联系。本文尝试将时间序列和关联分析进行有机结合,并以数控系统技术为案例进行了实证研究,研究表明基于时间序列的关联分析能更有效地反映技术变化的实际进程,深度揭示技术领域的动态变化。
- 汪雪锋赵晨晓衡晓帆王有国张琪
- 关键词:时间序列数控系统
- 基于署名顺序的作者活跃度比较研究被引量:11
- 2013年
- 合作研究及论文合著已成为科学研究的常态,而作者署名顺序也已成为学术研究的重点。本文采用线性函数模型和指数函数模型,并通过调整不同位次作者的贡献度及其权重,定量表征和对比了不同作者的活跃度及其差异,结果表明作者的活跃度不仅与论文总数有关,且合著论文中作者的署名顺序对其具有重要影响,特别是第一或第二作者数量影响尤甚。
- 衡晓帆闫佳丽汪雪锋王有国
- 关键词:活跃度