您的位置: 专家智库 > >

卓流艺

作品数:3 被引量:10H指数:1
供职机构:中国科学院过程工程研究所更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术理学更多>>

文献类型

  • 1篇期刊文章
  • 1篇学位论文
  • 1篇会议论文

领域

  • 2篇自动化与计算...
  • 2篇理学

主题

  • 3篇数据库
  • 3篇数据提取
  • 3篇化学数据库
  • 2篇XML
  • 2篇XML技术
  • 1篇基于XML
  • 1篇分布式
  • 1篇分布式WEB
  • 1篇XPATH
  • 1篇XSLT

机构

  • 3篇中国科学院过...
  • 1篇中国科学院研...

作者

  • 3篇卓流艺
  • 2篇李晓霞
  • 2篇郭力
  • 1篇袁小龙

传媒

  • 1篇计算机与应用...
  • 1篇第九届全国计...

年份

  • 1篇2007
  • 2篇2006
3 条 记 录,以下是 1-3
排序方式:
XML技术在化学深层网数据提取中的应用被引量:10
2006年
Internet上的化学数据库是宝贵的化学信息资源,如何有效地利用这些数据是化学深层网所要解决的问题。本文总结了化学深层网的特点,基于XML技术实现从数据库检索返回的半结构化HTML页面中提取数据的目标,使之成为可供程序直接调用做进一步计算的数据。在数据提取过程中,先采用JTidy规范化HTML,得到格式上完整、内容无误的XHTML文档,利用包含着XPath路径语言的XSLT数据转换模板实现数据转换和提取。其中XPath表达式的优劣决定了XSLT数据转换模板能否长久有效地提取化学数据,文中着重介绍了如何编辑健壮的XPath表达式,强调了XPath表达式应利用内容和属性特征实现对源树中数据的定位,并尽可能地降低表达式之间的耦合度,前瞻性地预测化学站点可能出现的变化并在XSLT数据转换模板中采取相应的措施以提高表达式的长期有效性。为创建化学深层网数据提取的XSLT数据提取模板提供方法指导。
卓流艺李晓霞郭力
关键词:XMLXSLTXPATH化学数据库
基于XML的化学深层网数据提取模板生成工具
分布在 Internet 上的化学数据库是宝贵的化学信息资源,化学深层网是这类数据库的集合,化学深层网检索的目标是利用一个查询,实现多个化学数据库数据的同时检索和数据集成。基于 XML 的化学深层网数据提取方法是通过构造...
卓流艺李晓霞袁小龙郭力
关键词:XML化学数据库
文献传递
分布式Web化学数据库的集成检索与数据提取
Internet上的化学数据库是宝贵的专业资源,基于超链接分析的搜索引擎只能检索到这类数据库的Web接口页面,不能对数据库中的数据进行直接检索,因此这类资源被称为深层网(Deep Web)。本文将Web化学数据库资源称为...
卓流艺
关键词:XML技术数据提取
共1页<1>
聚类工具0