韩京宇 作品数:72 被引量:250 H指数:7 供职机构: 南京邮电大学计算机学院 更多>> 发文基金: 国家自然科学基金 江苏省高技术研究计划项目 教育部留学回国人员科研启动基金 更多>> 相关领域: 自动化与计算机技术 经济管理 文化科学 交通运输工程 更多>>
基于标签相关性的K近邻多标签学习 被引量:2 2022年 多标签学习是机器学习领域的一个研究热点,其能够有效解决真实世界中的多语义问题。在多标签学习任务中,样本的多个标签之间存在一定的关联关系,忽略标签间的相关性会导致模型的泛化性能降低。提出一种基于标签间相关性的多标签学习K近邻算法。充分挖掘样本多标签间的相关性,通过Fp_growth算法得到标签的频繁项集。针对频繁项和标签分别构建评分模型和阈值模型,评分模型用于衡量样本与频繁项或标签之间的关联程度,阈值模型用于求解频繁项或标签对应的判别阈值,结合评分模型和阈值模型对样本所属频繁项进行预测,进而确定样本标签集。在经典数据集Emotions和Scene上的实验结果表明,该算法的F1-Measure指标分别达到66.6%和73.3%,相比CC、LP、RAKEL、MLDF等基准方法,其F1-Measure分别平均提高3.8和2.1个百分点,该算法通过合理利用标签间的相关性使得分类性能得到有效提升。 钱龙 赵静 韩京宇 毛毅关键词:K近邻 频繁项集 路网上基于时空锚点的移动对象群体和个体运动监测方法 被引量:1 2020年 为了实时监控路网上移动对象(车辆)的运动,各移动对象不断向中心服务器汇报其位置,中心服务器存储数据以响应用户的各种查询。此类方法不仅通信开销巨大,增加服务器负载,而且不能同时满足群体态势感知和个体移动对象位置追踪的需求。因此,提出一种基于时空锚点的双粒度移动感知(Double-granularity Movement Detection Based on Spatial-temporal Anchors,DMDSA)框架,将移动对象嵌入时空网格,其经过时空锚点时向服务器汇报其运动模式,实现对群体运动的感知和个体移动的追踪。离线阶段,服务器从历史轨迹中挖掘运动模式;移动对象运动时,服务器结合挖掘的运动模式,在线计算聚合模式表征群体运动,并采用最大似然估计确定目标的运动模式,实现群体态势感知;进一步,采用锚点独立策略和锚点序列策略识别最可能的运动序列,实时追踪个体对象的运动。在模拟数据集和实际数据集上的实验表明,所提方法在大幅度减小位置汇报代价的前提下,不仅能够准确地监控区域的群体运动态势,并且能够有效地追踪和预测个体移动对象的位置,有助于智慧城市的建设。 韩京宇 许梦婕 朱曼关键词:路网 基于差分编码的RDF分组压缩 被引量:1 2020年 语义网技术的发展使资源描述框架(RDF)的数据量迅速增长,导致其对存储空间与传输带宽的要求不断提高。现有的通用压缩方法和RDF专用压缩方法可以解决该问题,但仍存在数据冗余。为此,提出一种基于差分编码的RDF分组压缩算法。将RDF数据根据连接宾语的谓语组合进行分组,在消除宾语冗余的同时进一步减少谓语冗余。在此基础上,针对分组后得到的主语序列,通过引入差分编码技术进一步优化其存储空间。实验结果显示,与Plain、HDT和HDT++算法相比,该算法在结构化程度低的Archives Hub、Linkedmdb、rdfabout和DBpedia数据集中可获得平均17%的性能提升,在结构化程度高的dbtune数据集中可获得23%的性能提升,表明其对于不同结构化程度的数据集均具有较好的RDF压缩性能。 伍伟鑫 韩京宇 朱曼关键词:语义网 资源描述框架 数据压缩 差分编码 一种数据覆写方法 本发明涉及一种数据覆写方法,利用数据自身序列完成数据覆写,其中,将目标数据序列中对应数据位上的数据,采用“模2加”运算获得运算结果数据序列,构成数据覆写序列,然后利用数据覆写序列实现针对目标数据序列的覆写,降低了计算机资... 徐小龙 龚培培 金仙力 韩京宇 李爱群 刘大勇文献传递 基于交通路网的移动对象数据库系统的研究和设计 被引量:3 2007年 给出了在PostgreSQL基础上的基于交通路网的移动对象数据库系统的设计方案,系统地介绍了其体系架构、扩展的数据类型和操作以及代理中间层的功能设计。该系统为进一步研究移动对象更新算法以及移动对象数据索引提供了基础。 纪鹏程 丁治明 陈滨 韩京宇关键词:移动对象数据库 POSTGRESQL 交通路网 基于改进的RAKEL算法的心电图诊断分类 2022年 心电图(ECG)数据通常包含多种病症,而ECG诊断是一个典型的多标签分类问题。在多标签分类方法中,RAKEL算法将标签集随机分解为若干个大小为k的子集,并建立LP分类器进行训练;然而由于没有充分考虑标签间的相关性,LP分类器中容易产生一些标签组合所对应样本稀少的情况,从而影响预测性能。为了充分考虑标签间的相关性,提出一种基于贝叶斯网络的RAKEL算法BN-RAKEL。首先利用贝叶斯网络找到标签间的相关性,确定候选标签子集;然后对每个标签采用基于信息增益的特征选择算法确定其最优特征空间,并针对每个候选标签子集利用最优特征空间相似性来检测其相关程度,以确定最终的具有强相关性的标签子集;最后在标签子集的最优特征空间上训练LP分类器。在实际的ECG数据集上,与多标签K近邻(ML-KNN)、RAKEL、CC和基于FP-Growth的RAKEL算法FI-RAKEL进行对比,结果显示所提算法在召回率和F-score上最少提高了3.6个百分点和2.3个百分点。实验结果表明,BN-RAKEL算法有较好的预测性能,能有效提升ECG诊断的准确性。 赵静 韩京宇 钱龙 毛毅关键词:心电图 贝叶斯网络 信息增益 路网时窗排序的回归模型树轨迹索引 被引量:1 2022年 最近,通过学习型索引取代传统索引以减少索引大小和提高查询效率受到广泛关注.轨迹点在路网和时间维度的连续性难以刻画,数据分布倾斜普遍存在,现存的学习型索引不能有效地支持其查询.提出一种基于路网时窗排序的回归模型树,以支持点和范围查询,含数据排序和模型训练两个阶段:首先,结合希尔伯特曲线和模拟退火寻找保持道路临近性的路段排序,进而采用两层划分获取轨迹点的一维排序,保证时空近邻点排序后彼此靠近;其次,引入回归模型树映射轨迹点和存储位置,提出批量加载和周期更新两种训练模式.真实和模拟数据集上的实验表明,在保证和传统索引可比的查询性能前提下,大幅度降低索引大小,有效地支持以读为主的历史轨迹数据查询. 韩京宇 陆维 武凡 刘阳 葛康 朱曼 陈伟关键词:模拟退火 网络受限移动对象不确定性轨迹的索引 被引量:7 2008年 近年来,人们对于如何表示和处理移动对象的不确定性进行了研究,提出了一些较为有效的模型和算法。但是,在如何索引移动对象的不确定时空轨迹方面,相关的研究工作十分有限。为了解决上述问题,本文提出了一种网络受限移动对象不确定轨迹的索引结构(UTR-Tree),并给出了相关的索引更新及查询算法。在该索引结构的支持下,移动对象数据库不仅可以快速地处理对移动对象过去可能位置的查询,而且能够对其现在及将来的可能位置进行高效的查询处理。 丁治明 余波 李曼 韩京宇关键词:移动对象数据库 不确定性 索引 基于波段子序列比对的QRS波群形态识别方法 本发明提供一种基于波段子序列比对的QRS波群形态识别方法,在经过预处理包括滤波和去噪后的心电图的训练样本上,截取R波极值点前后设定长度区域形成QRS波群检测区域,划分为多个波段;生成波段的候选子序列集合;遍历候选子序列集... 韩京宇 郎杭 刘阳 武凡有向路网上基于同质区域划分的学习型轨迹索引和查询方法 本发明提供一种有向路网上基于同质区域划分的学习型轨迹索引和查询方法,通过为每个有向路段分别设置后续数组,记录通行量比值;从路网中心有向路段开始深度优先搜索,确定有向路段的唯一序号;有向路段先按照长度划分为若干个类,再按照... 韩京宇 刘阳 郎杭 武凡