王飞
- 作品数:6 被引量:41H指数:3
- 供职机构:武汉大学计算机学院更多>>
- 发文基金:国家自然科学基金中央高校基本科研业务费专项资金更多>>
- 相关领域:自动化与计算机技术更多>>
- 支持范围查询的低冗余知识图谱管理被引量:4
- 2019年
- 随着越来越多的数据以知识图谱的形式进行组织和发布,知识图谱的管理引起了大量的关注.现有知识图谱管理方法存在2个明显的缺陷:1)逻辑存储建模产生了大量的数据冗余,无法有效地支持连续属性的范围查询;2)语义存储建模代价昂贵,不能有效地适应查询的动态演化.提出了聚簇对象代理模型(cluster object deputy model, CODM)进行知识和元知识的建模管理.该模型具有2个特点,分别是模式化的逻辑存储建模和轻量级的语义存储建模.CODM设计了基于集合编辑距离的模式聚簇算法将知识图谱转化为模式数据,实现了数据的模式化存储,支持了面向属性数据类型的索引特化.此外,CODM构建类的层次系统建模实体之间的各种语义关联,采用对象指针实现了轻量级的泛化语义关联物化.实验结果证明:CODM不仅能够极大地减少数据冗余和有效地支持范围查询,而且加速了复杂查询的处理效率.
- 王飞钱铁云刘斌彭智勇
- 关键词:知识图谱范围查询
- 基于兴趣标签的缄默用户性别预测研究被引量:3
- 2015年
- 为解决社交媒体中缄默用户的性别预测问题,提出利用用户文件夹中的兴趣标签进行区分的方法.针对标签存在稀疏和歧义性的特点,设计了一种基于概念类推断用户性别的框架.首先依据社交心理特征将标签划分为若干概念类;其次通过关联挖掘方法扩充概念类;最后通过概念类压缩用户特征空间.在新浪微博真实数据集上进行验证,实验结果表明:所提方法对于缄默用户性别有显著的区分效果,在不使用任何微博信息的条件下,区分准确率达到71%.
- 钱铁云尤珍妮陈丽王飞
- 关键词:数据挖掘
- 对象代理数据库的双向指针存储优化方法被引量:3
- 2018年
- 在对象代理数据库中,提出了两个新的概念:代理对象和代理类.一个对象可以有一个或多个代理对象,该对象也被称为代理对象的源对象.代理对象可以从其源对象中选择性继承属性和方法,也可以扩展定义代理类自己的属性和方法.代理对象继承自源对象的属性称为虚属性,虚属性不实际存储其值,而是在查询时根据源对象的实属性值计算得到.对象代理数据库利用双向指针表来实现源对象和代理对象之间的这种关联,双向指针表中每一条记录包含两个字段,分别对应于源对象ID和代理对象ID.当存在多层代理关系时,查询代理对象需要对双向指针表执行多次查询操作,因而查询效率往往不是很好.文中针对代理对象查询效率低的问题进行了深入研究,发现其主要原因是双向指针表中具有相同代理类和源类的数据分布在不同的磁盘块中,查询双向指针表时需要多次I/O操作.基于此,文中首先设计新的对象代理数据库中空闲空间分配策略,在原有的空闲空间管理策略中加入新的索引信息,使得当需要添加记录时不仅使用空闲空间管理模块FSM查找空闲空间大小一个条件,而且结合使用索引中指定的聚簇信息寻找具有合适空闲空间的磁盘块,然后读取目标磁盘块到内存中,并将双向指针表中的元组以源类和代理类为单位进行分类写入磁盘块,从而实现基于代理关系的双向指针表的聚簇存储.同时针对具体的应用场景,文中根据数据库模式中代理层次信息、用户查询频率等因素设计一个I/O查询代价模型,利用该模型计算各级代理类与源类聚簇之后的查询代价,从而选择出一种查询代价最小,性能最优的聚簇策略,使得能够最大限度的减少I/O次数,提高代理对象的查询效率.实验结果表明,该聚簇方法在真实数据集上的优化效果比未优化平均提高15%以上,比已有的双向指针表的优化方�
- 胡聪睿刘斌刘斌王飞王飞
- 关键词:对象代理数据库
- 代码知识图谱构建及智能化软件开发方法研究被引量:25
- 2020年
- 智能化软件开发正在经历从简单的代码检索到语义赋能的代码自动生成的转变,传统的语义表达方式无法有效地支撑人、机器和代码之间的语义交互,探索机器可理解的语义表达机制迫在眉睫.首先指出了代码知识图谱是实现智能化软件开发的基础,进而分析了大数据时代智能化软件开发的新特点以及基于代码知识图谱进行智能化软件开发的新挑战;随后回顾了智能化软件开发和代码知识图谱的研究现状,指出了现有智能化软件开发的研究仍然处于较低水平,而现有知识图谱的研究主要面向开放领域知识图谱,无法直接应用于代码领域知识图谱.因此,从代码知识图谱的建模与表示、构建与精化、存储与演化管理、查询语义理解以及智能化应用这5个方面详细探讨了研究新趋势,以更好地满足基于代码知识图谱进行智能化软件开发的需要.
- 王飞刘井平刘斌钱铁云肖仰华彭智勇
- 关键词:知识图谱
- 基于单类支持向量机的目标跟踪算法研究
- 2014年
- 基于分类的跟踪算法成为当前目标跟踪的研究热点。首先把跟踪问题看成是一个目标和背景的二分类问题,根据每一帧的正负样本数据训练SVM分类器,通过分类器的分类概率值确定目标位置。然而,采集正负样本边界的那些样本很容易出现异常点,当把它们作为目标的下一帧位置时将会出现严重的跟踪漂移问题。为此,提出了一种基于单类支持向量机(One-class Support Vector Machine,One-class SVM)的目标跟踪算法,基于One-class SVM分类能有效地排除其他类的干扰,有效地防止异常样本的出现。并结合加权多示例采样方法,使得每个采样样本会根据不同的权值对于分类器的贡献而不同。仿真实验结果表明,改进的跟踪方法是可行的、有效的,有很好的鲁棒性。
- 农丹华王飞
- 关键词:目标跟踪单类支持向量机
- 支持技术创新的专利检索与分析被引量:6
- 2016年
- 介绍了目前专利检索和分析的主要研究工作,包括专利的可检索性、技术现状检索和相关性检索方法等,以及专利地图分析、新颖度分析和Patent Dom专利分析框架等分析方法。最后基于深度学习的思想,讨论了新一代的支持技术创新的专利检索方法、专利论文检索方法以及专利趋势分析方法。
- 刘斌刘斌冯岭王飞