王舒
- 作品数:4 被引量:3H指数:1
- 供职机构:中国科学技术大学计算机科学与技术学院更多>>
- 发文基金:国家自然科学基金安徽省自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 面向语义网络的实例抽取方法研究
- 随着Internet的不断发展,WorldWideWeb已经成为人们获取信息的重要来源之一。然而由于Web信息无法被机器所理解,使得迅速且准确地搜索到用户所需的有用信息变得越来越困难。
本文对Web文档的本体概...
- 王舒
- 关键词:网页信息语义网络语义标注本体分类
- 文献传递
- 一种基于Max Gap约束的高效序列模式挖掘算法被引量:2
- 2006年
- 如何有效地将约束与挖掘过程结合,将是提高基于约束的序列模式发现算法效率的关键。本文针对一种典型的强约束形式——MaxGap约束,提出了一种有效的序列模式挖掘方法。该方法利用MaxGap约束的特点,采用了高效的扩展单项剪枝策略,有效地减小了搜索空间的大小,提高了挖掘效率。实验结果表明,本文方法在性能上明显优于现有的方法。
- 陈恩红李铜舒王舒
- 关键词:序列模式挖掘剪枝策略
- 基于XML的网络信息处理方法与应用研究
- 陈恩红张曙光张振亚王进王舒
- 为了建立有效的基于XML的数据采集机制和处理方法,通过课题组成员的共同努力,针对XML的数据采集机制,提出了一种基于模式的半结构化数据抽取方法,并按OEM数据模型进行表示。在OEM半结构化数据表示模型上,提出了对象关联模...
- 关键词:
- 关键词:XML信息检索网络
- 基于最右扩展枚举的半结构化数据最大模式挖掘方法研究
- 2004年
- 本文以标记有序树作为半结构化数据的数据模型 ,研究了半结构化数据的树状最大频繁模式挖掘问题 .已有挖掘算法通常挖掘所有频繁模式 ,其中很多模式为其它模式的子模式 ,针对该问题 ,设计实现了一种最大模式挖掘算法 .该算法采用最右扩展枚举方法无重复枚举所有候选模式 ,利用频繁模式扩展森林实现高效剪枝扩展和挖掘频繁叶模式 ,通过计算频繁叶模式间的包含关系挖掘树状最大频繁模式 .
- 吴共庆陈恩红王舒王煦法
- 关键词:半结构化数据