王大亮
- 作品数:7 被引量:27H指数:3
- 供职机构:北京科技大学计算机与通信工程学院更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于领域本体的中医知识获取方法被引量:14
- 2008年
- 中医知识获取是计算机自动实现知识管理、知识重组的前提。中医领域存在大量非结构化知识,难以被深入获取。该文提出一种基于领域本体的知识获取方法,对选取的单一医案中蕴含的知识进行形式化表示,构造中医领域的语义网络,对其进行定量分析,抽取中医领域的概念语义场。实验结果表明,该方法可在一定程度实现中医领域的知识获取。
- 蒋宏潮王大亮张德政
- 关键词:本体中医语义场知识获取
- 基于XML的Web数据半自动采集被引量:4
- 2009年
- 如何在信息量巨大的互联网上准确获取并长期跟踪用户关注的内容,是数据采集和挖掘的重要方面。探讨Web数据采集理论及其应用技术,给出一个半自动采集模型,设计基于旅游业数据的采集系统,验证数据半自动采集的可行性。
- 蒋宏潮王大亮班晓娟阮进喜
- 关键词:数据采集信息采集半结构化数据
- 多策略融合的搭配抽取方法被引量:6
- 2008年
- 以往的词汇搭配抽取统计评价方法具有大致相同的效果,它们各有优劣,可以实现优势互补。该文提出多策略融合的搭配抽取方法。首先,将互信息法用于衡量二元独立性,淘汰候选的无关二元组。其次,对比2χ检验法与t检验法,发现使用2χ检验法能够更合理地反映搭配组合的同现性和期待性;然后,使用对数似然比检验法,解决其他方法无法克服的稀疏数据问题。此外,加入构词法的启发式规则,最终形成一个多策略融合的方法。实验结果表明该方法的准确率较高,在实际应用中取得良好效果。
- 王大亮涂序彦郑雪峰佟子健
- 关键词:信息处理统计评价自然语言处理
- 基于相对条件熵的搭配抽取方法被引量:3
- 2007年
- 针对以往研究将搭配视为词项的简单并置,而没有考虑词项间的倾向性问题,提出了一个基于相对条件熵的搭配倾向统计模型,衡量中心词对上下文同现词的依赖程度.此外,加入语言学启发式规则,利用词性过滤器和滑动窗口的方法识别搭配边界,最终形成了在开放语料库环境下的搭配抽取方法.该方法具有很强的解释性,有效地揭示了搭配构成的内在机理.经过证明,搭配倾向强度可以解释为由方向修正的互信息.
- 王大亮张德政涂序彦郑雪峰佟子健
- 关键词:自然语言处理相对熵
- 基于选择倾向性的词汇获取方法被引量:1
- 2008年
- 通过分析几种统计评价方法发现,互信息法可用于衡量二元独立性,淘汰机会二元组;χ2检验能更合理地评价词汇组合的选择倾向性,获取频繁二元组发现;对数似然比检验可以有效获取稀疏二元组,弥补其他方法无法克服的稀疏数据问题。将互信息、χ2检验、对数似然比检验组合,并加入词汇子范畴框架的启发式规则,提出一个层次分明的综合多种统计评价方法的词汇获取方法。
- 王大亮蒋宏潮涂序彦郑雪峰佟子健
- 关键词:自然语言处理新词发现
- 基于Petri网的业务流程评估
- 过程知识是构建领域知识库的关键要素,并且过程知识主要是利用过程模型来表示的。尽管已经出现了很多的过程知识表示方法,但都存在构建模型知识表达复杂困难,而且更关键是不容易进行过程知识验证。因而,本文提出了基于 Petri 网...
- 蒋宏潮王大亮班晓娟张德政
- 关键词:领域知识库过程知识PETRI网
- 文献传递
- 基于Petri网的业务流程评估
- 过程知识是构建领域知识库的关键要素,并且过程知识主要是利用过程模型来表示的。尽管已经出现了很多的过程知识表示方法,但都存在构建模型知识表达复杂困难,而且更关键是不容易进行过程知识验证。因而,本文提出了基于Petri网构建...
- 蒋宏潮王大亮班晓娟张德政
- 关键词:领域知识库过程知识PETRI网
- 文献传递