您的位置: 专家智库 > >

郑晓欢

作品数:12 被引量:124H指数:7
供职机构:中国科学院更多>>
发文基金:国家自然科学基金国家科技基础条件平台建设计划中国科学院战略性先导科技专项更多>>
相关领域:文化科学自动化与计算机技术自然科学总论经济管理更多>>

文献类型

  • 12篇中文期刊文章

领域

  • 8篇文化科学
  • 4篇自动化与计算...
  • 1篇经济管理
  • 1篇自然科学总论

主题

  • 8篇科学数据
  • 5篇数据共享
  • 2篇数据集
  • 2篇科学数据共享
  • 2篇出版
  • 2篇大数据
  • 1篇地理空间
  • 1篇地理空间数据
  • 1篇地球
  • 1篇地球科学
  • 1篇地学数据
  • 1篇生态圈
  • 1篇数据管理
  • 1篇数据可用性
  • 1篇数据库
  • 1篇推荐系统
  • 1篇开放共享
  • 1篇开放数据
  • 1篇可用性
  • 1篇空间数据

机构

  • 12篇中国科学院
  • 4篇中国科学院文...
  • 4篇中国科学院大...
  • 1篇山东理工大学
  • 1篇西南科技大学
  • 1篇中国农业科学...
  • 1篇科技部
  • 1篇国家科技基础...

作者

  • 12篇郑晓欢
  • 3篇周园春
  • 3篇陈明奇
  • 3篇黎建辉
  • 2篇房俊民
  • 2篇沈志宏
  • 2篇王卷乐
  • 2篇褚大伟
  • 2篇陈昕
  • 2篇孔丽华
  • 1篇李成赞
  • 1篇张娟
  • 1篇杜一
  • 1篇汪洋
  • 1篇张晓林
  • 1篇胡良霖
  • 1篇赵以霞
  • 1篇朱艳华
  • 1篇唐川
  • 1篇杨子辉

传媒

  • 4篇中国科学数据...
  • 1篇情报科学
  • 1篇世界科技研究...
  • 1篇地理研究
  • 1篇图书馆
  • 1篇地球科学进展
  • 1篇中国科学院院...
  • 1篇大数据
  • 1篇中国教育信息...

年份

  • 3篇2023
  • 1篇2021
  • 4篇2019
  • 3篇2018
  • 1篇2016
12 条 记 录,以下是 1-10
排序方式:
2018年中国科学院继续教育网科研人员在线学习数据集
2019年
为更好地面向科研人员提供学习服务,促进科技创新发展,中国科学院继续教育网为科研人员提供在线学习服务,科研人员自主选学课程。2018年1月1日至2018年12月31日,共积累219472条学习数据,学习时长为212382.74小时。初步数据分析结果显示,10–12时和14–18时是学习行为产生的高峰期,但晚上18–24时也有相当数量的学习行为,不可忽视。每次学习时长与性别年龄无显著相关,科研人员最感兴趣的学习内容更多聚焦在人工智能和大数据方面。通过数据集,可以分析不同专业技术职称、不同年龄、不同性别、不同工作年限科研人员的在线学习时间点倾向、学习内容倾向和学习时长倾向,为精准服务科研人员在线学习奠定基础。
赵以霞赵以霞金昆郑晓欢
基于关联规则的国内外数据期刊载文特征比较分析——以《Scientific Data》和《中国科学数据》为例被引量:14
2019年
【目的/意义】研究数据期刊的载文特征,对于数据期刊管理和相关学科布局具有重要意义。【方法/过程】以《Scientific Data》和《中国科学数据》两种数据期刊所刊载的论文为研究对象,分别获取文章的作者信息、收稿时间、发表时间、学科类别、参考文献数量等内容信息,经过初步处理后进行关联规则分析,剪除无用规则并匹配后得到关联特征。【结论/结果】通过关联特征发现:《Scientific Data》的作者以美国为主,英国、德国、中国、日本等国家也积极参与,文章的参考文献数量主要集中在20-40篇之间;《中国科学数据》的作者主要是中国科学院部分院所,但院外机构较少,文章的参考文献数量主要集中在0-20篇之间。两种期刊所载文章的收录发表时间差大多在100-200天之间,地球科学和生物科学均是两种期刊的重点关注领域,但两种期刊对社会科学领域重视程度不够。
温亮明郭蕾王晓东郑晓欢黎建辉
关键词:关联规则
科学数据管理态势及其对我国地球科学领域的启示被引量:25
2019年
科学数据是重要的科技基础条件和国家战略资源。随着大数据时代的到来,全球各国纷纷将科学数据管理纳入国家发展战略。为了完善我国科学数据管理并抓住这个大数据发展机遇,国务院办公厅于2018年3月正式印发《科学数据管理办法》。在这一新的国际、国内数据管理政策环境下,分析归纳了全球11个方面的科学数据管理态势,并剖析了发达国家科学数据中心发展模式,针对我国地球科学领域科学数据管理,提出了科学数据政策制定、科学数据中心建设、科学数据生命周期管理、数据机构能力建设、科学数据认证、数据出版、科学数据回报机制、数据综合集成和安全管理等方面的启示与展望。
王卷乐王明明石蕾石蕾陈明奇陈明奇郑晓欢王玉洁
关键词:地球科学数据共享大数据
全球高性能计算发展态势分析被引量:13
2018年
高性能计算对现代社会的科学研究、社会服务、经济活动而言,已成为不可或缺的战略工具,全球众多国家都极为重视高性能计算能力的建设与发展。尤其是随着超级计算机的速度日益提升,以及摩尔定律即将失效的现实,主要国家和地区都将重心放到研发下一代高性能计算机和超级计算机上,引发了新一轮围绕高性能计算机的竞争。本文回顾了近年来美、欧、日等主要国家和地区在高性能计算方面的战略规划与项目部署,分析了现阶段高性能计算发展的挑战与相关发展趋势,最后讨论了我国高性能计算的研制与应用进展,以及可进一步提升的空间。
郑晓欢陈明奇唐川张娟房俊民
PARIS原则:开放协作环境下科学数据的可用性
2023年
科学数据利用的需求日益迫切,且在“第四范式”“融合科学”等新型科研范式带来的开放协作环境下,呈现出跨边界、端到端、动态性和协作化的特征。作为“数据仓储时代”的产物,FAIR、TRUST原则已无法为开放协作环境下科学数据的高效利用提供深入的指导。详细分析了科学数据利用的典型场景,提出开放协作环境下促进科学数据利用的PARIS原则:可处理(processable)、可问答(askable)、可信赖(reliable)、可联合(incorporable)与可供给(suppliable),并重点分析了PARIS原则对科学数据可用性的促进作用。最后,探讨了实现PARIS原则可参考的技术路径。作为FAIR、TRUST原则的有益扩展,期望PARIS原则能有效提升科学数据的可用性。
沈志宏张晓林郑晓欢
关键词:数据可用性
中国科学院科学数据标准体系研究与实践被引量:13
2019年
针对科学数据资源多源且异质异构的复杂特点,中国科学院制定了完善的科学数据标准体系,研制并发布实施了包括数据采集与加工、元数据、数据管理、数据质量、数据服务等方面40余项标准规范,内容全面覆盖了科学数据资源全生命周期的关键业务节点,并根据需要集成到5个指导规范中。本文全面总结了中国科学院在科学数据标准规范方面取得的主要成果,以期为落实国家《科学数据管理办法》提供参考借鉴和解决方案。
胡良霖郑晓欢朱艳华高瑜蔚周园春
关键词:科学数据
国内外科学数据管理与开放共享的最新进展被引量:46
2018年
作为科研活动的灵魂,科学数据既是激发科研创新的起点,也是科研活动丰富成果不可或缺的部分。国内外科学数据管理与共享从"积极温和的科学数据政策导向"和"全面细致的科学数据管理实践"两方面开展。通过对国内外发展现状的比较,笔者认为,国内的科学数据政策宏观体系尚待拓展,政策落实仍需继续积累;仍有很多学科门类需要提高数据管理意识和管理水平;科学研究的整体环境有利于开放科学数据文化的孵化,但仍需多利益相关群体的综合协调。未来,积极温和的共享趋势仍占据主流,科学数据的公、私权力争论愈演愈烈,信息技术变革与科学数据管理边界的再认识将持续推动数据开放。
张丽丽温亮明石蕾郑晓欢黎建辉
关键词:科学数据共享开放数据
全球科学数据出版发展态势分析--基于Web of Science数据库的调研被引量:11
2021年
科学数据出版是推动科学数据共享,实现科学数据价值最大化的重要方式。本文通过对全球科学数据出版数据进行分析,探求全球科学数据出版发展态势。对Web of Science数据库中的数据论文和数据集记录进行检索,通过数据统计方法从时间、国家/地区、研究方向、出版来源、影响力等维度进行分析。从时间维度看,科学数据出版整体呈现蓬勃发展的态势。国家/地区维度上,美国处于领先地位,中国虽然取得巨大成就,但与美国依旧存在巨大差距。研究方向维度上,科学数据出版在自然科学、社会科学等研究领域均具有重要的科学价值。出版来源维度上,中国虽然科学数据出版数量领先,但科研人员更倾向于选择国外出版物、存储平台进行数据发布。影响力维度上,中国科学数据的影响力与欧美国家存在一定差距。
王卫军李成赞郑晓欢郑晓欢褚大伟陈昕陈昕杜一
关键词:科学数据数据集
基于混合过滤的地学数据个性化推荐方法设计与实现被引量:6
2018年
推荐系统是帮助互联网用户克服信息过剩的有效工具。在地学数据共享领域,较其他物品的内容属性,地学数据具有更加丰富的时空属性,这也给地学数据推荐带来挑战。针对地学数据的特点,为地学数据共享推荐服务开发了一种动态加权的混合过滤方法。该方法分别采用协同过滤和基于内容过滤算法预测用户对数据的兴趣度,再以训练模型计算最优加权权重,计算最终预测评分。在数据获取阶段,通过用户访问日志数据,采用Jenks Natural Break算法分析用户访问记录获取用户的数据兴趣度。在基于内容过滤部分,通过数据的空间、时间及内容属性计算数据相似度,并以用户历史行为为依据计算用户兴趣。在协同过滤和基于内容过滤中分别采用k-NN算法计算用户对未访问数据的预测评分,并进行加权求和。通过训练集,对理想权重值及用户的共同评价度(co-rating level)进行建模,拟合二者的关系。该模型被应用于混合过滤的权重调整,以获得最优的加权方程。测试结果显示,结合数据时空属性的混合过滤方法的准确度和召回率,较单一的协同过滤或基于内容过滤方法有显著提高。
王末郑晓欢王卷乐柏永青
关键词:地理空间数据推荐系统科学数据共享
深化落实数据要素政策,建立健全科学数据生态圈被引量:2
2023年
数据成为基础性、战略性资源已在国内外形成广泛共识,数据已成为与土地、劳动力、资本、技术并列的一种生产要素。科学数据是数据要素的重要组成部分,高质量的科学数据是推动国家科技发展所必需的重要战略资源。本文通过对科学数据具有的开放性、多层次融合演化、生存周期管理等特点进行重点研究,分析我国科学数据发展的现状与面临的问题,综合提出建立健全科学数据生态圈的建议,通过建立健全数据基础制度,建立多元主体的科学数据治理框架,加强科学数据基础设施服务能力建设和人才培养,逐步形成科学数据生产-利用-共享-再利用的良性循环。
汪洋郑晓欢班艳孔丽华
关键词:科学数据
共2页<12>
聚类工具0