您的位置: 专家智库 > >

国家科技支撑计划(2006BAH02A05-06)

作品数:1 被引量:7H指数:1
相关作者:顾轶灵郑骁庆沈元一更多>>
相关机构:复旦大学更多>>
发文基金:国家自然科学基金国家科技支撑计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇电子商务
  • 1篇信息抽取
  • 1篇医药电子商务
  • 1篇语义词典
  • 1篇商务
  • 1篇WEB信息
  • 1篇WEB信息抽...
  • 1篇XPATH
  • 1篇DOM
  • 1篇抽取
  • 1篇抽取算法

机构

  • 1篇复旦大学

作者

  • 1篇沈元一
  • 1篇郑骁庆
  • 1篇顾轶灵

传媒

  • 1篇计算机系统应...

年份

  • 1篇2011
1 条 记 录,以下是 1-1
排序方式:
基于语义的互联网药品信息抽取算法被引量:7
2011年
针对现有互联网信息抽取技术存在准确率不高、覆盖率低、人工干预多等诸多缺陷,提出了一种新的互联网药品信息抽取算法,通过引入语义技术构建三维语义词典,屏蔽不同药品信息网页在内容和结构上的异构性,同时利用所需抽取的目标药品属性信息具有一定聚集度的特征,基于信息熵的理论设计出对目标信息智能定位和抽取的方法。实验证明该算法既能降低人工干预,又具备较高的准确率和召回率。应用该算法能实时自动全面准确地获取互联网药品信息,为政府药监部门提供丰富的监管依据,对规范医药电子商务市场,保证人们的用药安全具有重要的现实意义。
沈元一郑骁庆顾轶灵
关键词:WEB信息抽取语义词典DOMXPATH医药电子商务
共1页<1>
聚类工具0