车成逸
- 作品数:3 被引量:13H指数:2
- 供职机构:东北大学信息科学与工程学院更多>>
- 发文基金:国家自然科学基金中央高校基本科研业务费专项资金教育部“新世纪优秀人才支持计划”更多>>
- 相关领域:自动化与计算机技术更多>>
- Web页面中数据表的识别方法研究
- 2012年
- 为提高Web数据表识别的准确性,提出一种基于支持向量机与混合核函数的数据表识别方法。给出表格的结构特征、内容特征以及行(列)相似特征,将多项式核函数和线性核函数组成混合核函数,利用其进行Web数据表的自动识别。实验结果表明,该方法在7个站点上,准确率和召回率的平均值为95.14%和95.69%。
- 车成逸马宗民焦晓龙
- 关键词:WEB页面特征抽取支持向量机核函数
- 基于结构化信息源的本体构建方法综述被引量:11
- 2012年
- 作为一种能够在语义层和知识层上描述信息系统的概念建模工具,本体在许多领域得到了广泛应用。由于本体的构建和维护工作费时费力,本体的构建方法研究成为了实现语义Web应用的最重要技术。综述了从不同的结构化信息源(数据库、XML文档以及Web表格)构建本体的方法,进行了详细分析与对比,并给出其存在的不足之处以及未来可能的研究方向。
- 车成逸马宗民焦晓龙
- 关键词:本体构建数据库XML文档WEB表格
- Web表格中本体实例自动获取方法被引量:2
- 2012年
- 当前许多领域信息都采用表格形式展现,因此,如何从表格中抽取本体逐渐引起了人们的关注.为了提高从Web表格中抽取本体实例的准确性,提出了基于语义相似度的词汇语义类的获取方法.该方法采用了基于SVM的语义相似度计算方法,提高了判断语义相似度的准确性,克服了以前依靠句法相似度分析表格结构存在的局限性.最后,根据实验结果,对该方法的性能进行评估.实验结果显示,该方法可以有效地从Web表格中抽取本体实例.
- 车成逸马宗民焦晓龙
- 关键词:WEB表格语义相似度交互信息量支持向量机