国家社会科学基金(05BTQ006)
- 作品数:10 被引量:153H指数:6
- 相关作者:张智雄赵琦刘建华徐健吴振新更多>>
- 相关机构:中国科学院中国科学院研究生院中山大学更多>>
- 发文基金:国家社会科学基金更多>>
- 相关领域:文化科学自动化与计算机技术医药卫生更多>>
- 从ACE会议看信息抽取技术的发展趋势被引量:14
- 2008年
- 介绍ACE测评会议的概况及其发展轨迹。在此基础上,结合ACE测评会议的测评任务、参加队伍、测评语料、测评结果等变化,分析信息抽取的发展现状,并对信息抽取的发展趋势进行探讨。
- 赵琦刘建华冯浩然
- 关键词:ACE信息抽取
- 基于Ontology的信息抽取技术方法分析被引量:3
- 2009年
- 本文通过对国内外OBIE理论和OBIE系统的分析,比较了OBIE技术与传统信息抽取技术的主要区别,归纳了4种主要的技术方法,分别是基于实例的OBIE,基于规则的OBIE以及基于机器学习的OBIE和Ontology驱动的OBIE,并用案例对各种技术方法做了阐释,最后总结了OBIE研究和系统开发中存在的难点问题。
- 洪娜张智雄刘建华
- 关键词:本体信息抽取信息技术
- 主题发现技术方法研究被引量:11
- 2009年
- 介绍了主题发现的技术思路,同时分析了主题发现的相关核心技术及典型应用系统,最后提出了主题发现待解决的一些问题。
- 赵琦张智雄孙坦许雁冬
- 关键词:主题发现主题聚类本体
- 国外主要知识抽取项目介绍与评析被引量:4
- 2007年
- 分别介绍国外主要知识抽取项目如AKT、SEKT和ArtEquAKT等,并进行比较和评析。
- 龚立群孙洁丽
- 关键词:知识抽取语义网本体信息抽取数字图书馆
- 当前知识抽取的主要技术方法解析被引量:22
- 2008年
- 对MnM、KIM、Text2Onto、Amilcare、Melita等具有知识抽取功能的系统所应用的技术方法进行解析。提出在当前知识抽取技术中,机器学习和自然语言分析两大思路各自得到较大发展,并且在相互融合、相互借鉴中受益。在基于机器学习的知识抽取方面,出现以自适应信息抽取(Adaptive IE)、开放信息抽取(Open IE)为代表的新思路,并且有向自动本体学习(Ontology Learning)方向发展的趋势;在基于自然语言分析的知识抽取方面,基于模式标注、语义标注的方法得到广泛关注和进一步完善,并且有向基于Ontology的信息抽取(OBIE)方向发展的趋势。此外,为减少Ontology建设成本,让人们可以利用简单的自然语言构建Ontology,基于受控语言的信息抽取(CLIE)技术也得到一定的关注。
- 张智雄吴振新刘建华徐健洪娜赵琦
- 关键词:知识抽取本体
- 自动术语识别--对科技文献进行文本挖掘的重要技术方法被引量:12
- 2008年
- 自动术语识别是知识抽取和文本挖掘等信息技术中的关键步骤。研究现有自动术语识别的主要思路,明确其中的关键问题,研究已有的相关项目和系统的术语识别方法,并分析现有的一些术语资源。借此丰富基于术语识别的文本挖掘理论和方法,为进一步构建相关试验系统提供良好借鉴。
- 刘建华张智雄徐健许雁冬
- 基于Medline的医学数据挖掘系统研究被引量:4
- 2007年
- 选择基于Medline的医学数据挖掘系统中应用效果较好,具有普遍特性的3个系统进行分析,探讨系统的研究背景,在具体实现上所采取的技术思路和方法,总结其在设计和实现中普遍性和规律性的特点,供实践参考。
- 殷蜀梅
- 关键词:MEDLINE医学数据挖掘
- 实体关系抽取的技术方法综述被引量:63
- 2008年
- 对实体关系抽取研究以MUC和ACE评测为主线的发展进行总结,并指出实体关系抽取任务普遍存在的三个问题是特定领域标引数据集的获取、模式的获取以及共指消解。在对当前关系抽取的相关文献、系统和项目进行分析研究的基础上,将基于非结构化文本的实体关系抽取技术方法归纳为:基于模式匹配的关系抽取、基于词典驱动的关系抽取、基于机器学习的关系抽取、基于Ontology的关系抽取以及混合抽取方法,旨在为进一步构建实体关系抽取系统提供良好借鉴。
- 徐健张智雄吴振新
- 关键词:实体关系抽取信息抽取
- 文本可视化及其主要技术方法研究被引量:25
- 2008年
- 文本可视化是通过对文本资源的分析,发现特定信息,并利用计算机技术将其以图形化方式呈现来的一种方法。通过分析文本可视化典型系统,分析现今的文本可视化的特点。并从基于词汇、基于篇章、基于时间序列、基于主题领域4种不同的文本可视化方式入手来分析其的主要技术方法。最后探讨文本可视化如何在信息环境下发挥作用。
- 赵琦张智雄孙坦
- 关键词:知识表示主题发现
- 一种从医学文本中实现自动关键词抽取和筛选的技术方法被引量:4
- 2008年
- 鉴于重要关键词对于文本有着重要的强文本表示功能,关键词抽取和筛选在信息检索、信息抽取和知识挖掘等领域中有着重要的作用。在调研当前关键词抽取的方法后,结合医学领域已有的叙词表和工具以及BM25F加权词频公式提出基于医学文本的重要关键词抽取和筛选的技术方法。该方法主要解决两个关键问题:关键词的识别和抽取、关键词重要性的衡量和筛选。以2001-2007年骨关节炎领域的文献集合为数据来源,对该技术方法进行实践尝试,并验证其实际有效性,为知识挖掘中的重要关键词抽取提供一个行之有效的途径。
- 殷蜀梅张智雄吴振新
- 关键词:关键词抽取医学数据挖掘