您的位置: 专家智库 > >

北京市教育委员会科技发展计划(KM200910005027)

作品数:1 被引量:1H指数:1
相关作者:杨洋翟东升更多>>
相关机构:北京工业大学更多>>
发文基金:北京市自然科学基金国家自然科学基金北京市教育委员会科技发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇信息抽取
  • 1篇可扩展
  • 1篇可扩展标记语...
  • 1篇扩展标记语言
  • 1篇XML
  • 1篇XML技术
  • 1篇XSLT
  • 1篇标记语言
  • 1篇抽取
  • 1篇抽取系统

机构

  • 1篇北京工业大学

作者

  • 1篇翟东升
  • 1篇杨洋

传媒

  • 1篇北京工业大学...

年份

  • 1篇2011
1 条 记 录,以下是 1-1
排序方式:
基于XML技术的USPTO专利抽取系统被引量:1
2011年
为了给北京市知识产权预警能力研究提供基础数据,通过检索美国专利商标局(USPTO)网络专利数据库可以得到动态网页形式的专利信息.基于XML相关技术,提出了将这些网页形式的专利数据抽取到关系数据库的技术和方法.使用正则表达式匹配的方法进行页面过滤,将网页解析为文档对象模型(DOM)进行清洗,通过可扩散样式表转换语言(XSLT)模板抽取专利信息,并通过对象映射的方法将专利信息存入关系数据库,实现了专利信息抽取原型系统.实验结果表明,该原型系统具有较高的召回率和准确率.
翟东升杨洋
关键词:信息抽取
共1页<1>
聚类工具0