杨冬菊 作品数:50 被引量:160 H指数:8 供职机构: 北方工业大学 更多>> 发文基金: 国家自然科学基金 博士科研启动基金 北京市教育委员会科技发展计划 更多>> 相关领域: 自动化与计算机技术 政治法律 更多>>
一种用户需求驱动的服务匹配方法 本发明提供一种服务匹配的方法,所述服务采用服务基础模型,包括:服务名称、类型、领域、标签、操作、服务质量的属性信息,所述方法包括:接收用户输入的需求,所述需求至少包括服务名称的关键词、类型、领域和标签;匹配所述用户的相似... 杨冬菊 张慧颖一种融合词向量扩充和主题模型的服务分布式聚类方法 本发明提供一种融合词向量扩充和主题模型的服务分布式聚类方法,包括:步骤1,提取服务描述文本中的服务特征词;步骤2,获取所述服务特征词的词向量,生成服务描述库;步骤3,根据服务特征词的词向量基于主题模型获取服务文档‑主题矩... 杨冬菊 何丹基于关系挖掘和对抗训练的多标签文本分类 2024年 传统的多标签文本分类方法存在忽略标签语义、没有充分利用文本与标签以及标签与标签之间的关系等问题。为了解决以上问题,论文提出了一种基于关系挖掘和对抗训练的多标签文本分类模型。该模型利用了BERT模型和图注意力网络(GAT)分别提取文本的语义信息和挖掘标签之间的关系。首先,通过BERT模型对文本进行编码,以获取文本的语义信息。然后,使用图注意力网络(GAT)来挖掘标签之间的关系,以更好地理解标签之间的依赖关系。为了进一步挖掘文本与可学习的标签嵌入之间的关系,该模型采用了多头自注意力机制。此外,为了提高模型的鲁棒性,论文采用了R-drop策略进行模型训练。实验结果表明,在AAPD和RCV1数据集上,所提出的模型相比当前一些主流的多标签文本分类模型,不仅能够关注文本信息,还能够有效捕捉文本与标签之间的依赖关系以及标签与标签之间的关系,从而取得更好的性能。 杨冬菊 程伟飞关键词:归一化 大数据环境下基于元模型控制的数据质量保障技术研究 被引量:10 2019年 数据集成环节,越来越丰富的异构源数据给集成后数据质量的提升带来了新的挑战和困难。针对传统ETL模型在数据集成后出现的数据冗余、无效、重复、缺失、不一致、错误值及格式出错等数据质量问题,提出了基于元数据模型控制的ETL集成模型,并对数据集成过程中的各种映射规则进行了详细的定义,通过将抽取、转换、加载环节的元模型和映射机制相结合,能够有效地保证集成后数据的数据质量。提出的元模型已经应用到科技资源管理数据集成业务中。通过科技资源管理数据集成实例分析,验证了此数据集成方案能够有效地支撑大数据环境下数据仓库的构建和集成后数据质量的提升。 杨冬菊 杨冬菊关键词:大数据 ETL 元数据模型 数据集成 分布式时空相关服务网络构建及其在IOT服务发现中的应用 被引量:1 2020年 随着IOT(Internet of Things)服务的规模不断扩大,IOT服务的分布式管理是必然趋势。基于时空相关属性快速发现一组满足要求的IOT服务是IOT服务管理与使用中要解决的首要问题。传统的根据语法或语义进行服务发现的方法通常面对的是海量、离散的服务集合,服务发现时间与服务规模关系密切,并且在多次迭代递进的服务发现请求中结果无法重用。针对上述问题,提出了一种分布式时空相关服务网络的构建方法,利用服务之间的时空聚合关系与时空连接关系在离散、独立的服务之间建立关联,从而通过构建时空相关服务网络对服务进行组织与管理,重点探讨分布式环境下时空相关服务网络的构建、演化方法,以高速公路紧急事件处置场景作为案例,讨论基于服务网络的服务快速发现。 杨冬菊 赵卓峰关键词:服务网络 一种业务级的服务信息管理方法和装置及系统 本发明公开了一种业务级服务信息管理方法和装置及系统。该方法包括:建立领域语义规范;基于领域语义规范构建业务级服务模型;按照业务级服务模型,构建业务级服务。该业务级服务信息管理装置,包括:业务规范管理模块,用于导入和管理领... 赵卓峰 房俊 丁维龙 程婧 李焱 杨冬菊 韩燕波文献传递 基于云存储的二阶段动态优化调度机制 被引量:2 2014年 在分布式存储的研究中,如何高效地利用存储空间是个热点问题。存储集群中,每个数据节点存储容量不可能完全一致,由于主节点选择数据节点的随机性,被选中数据节点磁盘可能接近满额,此时主节点会自动做存储负载均衡,占用数据传输带宽,不仅影响数据传输的性能,而且会引起传输数据的不可靠。论文提出一种基于云存储的二阶段动态优化调度机制:第一阶段通过计算副本存储优选比率,采用基于贪心算法的局部优化存储方案,选择存储节点,均衡副本放置空间;第二阶段采用实时监控存储集群,动态调整副本放置节点,达到存储资源的高效利用。最后通过实验,验证了该调度机制可有效地放置副本,减少节点间的数据传输,并提高文件访问效率。 任川 杨冬菊关键词:优化调度 贪心算法 面向信息资源聚合的物联网智能信息中心框架 被引量:2 2015年 物联网技术以主动感知、智能分析和反馈控制为基本要素,实现对"物体"的识别、监控和管理,在诸多领域取得显著的应用成效,同时也暴露出应用建设分散、缺乏体系、重复建设现象严重等问题。从回顾物联网的发展历史出发,对物联网技术架构和相关工作进行分析,提出面向信息资源聚合的物联网智能信息中心框架,通过对多源、分布、异构资源的汇聚、整合、分析与再加工,为实现资源共享、提高资源利用率、解决重复建设问题提供基础性支撑,并重点讨论了传感设备的标准化封装与接入、信息资源的一体化管理等关键技术。最后,通过在农业物联网中的应用示例分析了该框架的效果。 杨冬菊 林绍福 张程关键词:物联网 HDFS异构集群中的分级存储调度机制 被引量:5 2017年 大部分存储集群构建时可能包含有遗留设备及新购置设备,这些设备在存储性能方面存在较大差异.采用HDFS默认的机架感知存储策略时,可能使访问频率高的数据存储在低性能节点上,而访问频率低的数据存储在高性能节点上,既影响集群响应时间,又降低了资源利用率.针对以上问题,提出一种分级存储调度机制.在HDFS机架感知调度策略基础上,首先根据节点的CPU、内存大小、磁盘大小、磁盘I/O等固有硬件性能将节点划分为高配置节点和低配置节点,其次根据节点的CPU使用率、内存使用率、网络带宽使用率、磁盘使用率等性能的动态因素建立节点的性能评价模型,并建立三个性能级别.根据节点配置情况、性能级别及网络位置等多方面因素进行综合调度.同时在集群运行过程中,会根据数据的访问频率对数据块的分布进行动态调整.实验结果表明,本文提出的分级存储调度机制可以在HDFS异构集群中提高数据的访问效率,优化集群性能. 杨冬菊 李青 邓崇彬关键词:HDFS 异构集群 存储调度 一种支持科技信息资源共享的数据服务模型 被引量:1 2011年 提出一种用于科技信息资源共享的数据服务模型,支持以服务的形式发布并共享各类科技数据,特别是能在服务层面对数据的容量、冗余度、异常情况,以及完整性等数据本身的质量信息加以描述,并给出了这些质量信息的获取和更新方法.在服务层面为用户提供数据特征和数据质量的参考信息,有利于用户对科技信息资源的选择和使用,能够实现科技信息资源的有效共享,通过在全国科技信息服务网项目中的应用,初步验证了其效果. 汤怀美 张程 杨冬菊关键词:数据质量 资源共享