张徵
- 作品数:5 被引量:5H指数:1
- 供职机构:复旦大学更多>>
- 发文基金:国家高技术研究发展计划上海市科学技术委员会科研基金海洋公益性行业科研专项更多>>
- 相关领域:自动化与计算机技术更多>>
- 不确定数据的ToP-K关键字检索
- 关键字检索和不确定数据处理是近年数据库领域的两个研究热点。本文研究的主题是在含有不确定数据的关系数据库和XML数据库上了运用关键字方法,检索用户查询的关键字。本文的研究成果通过将关系数据库和XML的关键字检索技术和不确定...
- 张徵
- 关键词:不确定数据关系数据库查询结果
- 基于本体的工程数据关键字检索和排序方法被引量:1
- 2014年
- 工程数据大量存在于现代生产制造企业。传统工程数据上沿用的关键字查询方法具有难以处理各种异构文档、无法识别关键字在工程领域的语义等缺陷。针对此,提出一种新的工程数据关键字检索方法。该方法先通过建立代表工程数据的本体,对各种异构的工程文档用适合的工具提取文本信息,建立XML快照。XML快照为索引关键字标注了相对应的本体概念。检索框架首先将用户的查询关键字匹配到本体的概念上,在匹配的过程中,提出一种算法消减关键字的语义混淆。在此基础上,提出一种排序模型,该模型对符合查询的XML快照进行打分排序,打分着重考虑了快照在语义上满足关键字查询的程度。检索框架最后排序并返回快照对应的原始文档给用户,使异构的工程数据文档能被统一处理和查询。该方法在工程数据上的检索结果查全率、查准率高,检索结果排序合理,能适用于实际企业中的大量工程数据文档,解决了传统工程数据检索的不足。实验使用了实际数据集,验证说明了该方法的实际有效性和性能上的高效性。
- 张徵杨卫东李心玥施伯乐
- 关键词:工程数据关键字本体XML快照
- 快速路行程速度突变段挖掘和基于相似匹配的短时预测算法
- 2017年
- 城市快速路交通流具有明显的畅通和拥塞时段交错的特征,其间行程速度产生较大变化。基于上海快速路线圈感应器采集的数据,首先提出一种在交通时间序列上线性时间挖掘行程速度突变段的滑动窗口方法,解决了识别拥塞起止时刻等需求。然后,构建突变段历史样本数据库和自定义索引,提出一套经过多重优化的基于相似度匹配的预测模型,达到对行程速度短时预测的目的,相比传统的回归方法更简单实用。最后,利用大量实际数据对两套模型的效果和性能进行了检验。结果表明,挖掘算法通过简单的参数调校可完成不同尺度的突变段查询,而预测算法能有效满足实时查询的性能要求,15 min的预测精度能达到90%左右。
- 李心玥杨卫东张徵许海波
- 关键词:时间序列相似度
- 基于本体的工程数据关键字检索方法
- 本发明提供一种基于本体的工程数据关键字检索方法,其特征在于,包括以下步骤:步骤S1,引入工程数据的领域本体和工程数据术语表,对工程数据术语表进行倒排索引生成倒排索引表;步骤S2,将工程数据中的若干类文档处理为XML快照并...
- 刘木强张徵杨卫东
- 文献传递
- 不确定数据库上的top-k关键字查询被引量:3
- 2011年
- 关系数据库上的关键字检索和不确定数据处理过去一直是两个独立的研究方向。研究了运用关键字方法检索不确定数据的问题,定义了不确定关键字查询的基本模型和语义,提出了一种在属性级粒度的不确定数据库上进行top-k关键字检索的算法。该算法根据用户指定的k值,计算并返回分数最高的前k个结果,其查询结果的评价函数综合考虑了结果与关键字的相关度和结果在可能世界语义下的概率大小。对算法进行了优化,显著降低了计算复杂度。最后通过实验,证明了算法的高效性和实用性。
- 张徵杨卫东朱皓
- 关键词:关键字检索TOP-K