您的位置: 专家智库 > >

陈源

作品数:3 被引量:7H指数:2
供职机构:四川大学计算机学院更多>>
发文基金:国家自然科学基金国家教育部博士点基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇中文期刊文章

领域

  • 3篇自动化与计算...

主题

  • 1篇信息处理
  • 1篇隐马尔科夫模...
  • 1篇隐马尔可夫模...
  • 1篇生物医学
  • 1篇松耦合
  • 1篇中文
  • 1篇中文信息
  • 1篇中文信息处理
  • 1篇文本分割
  • 1篇马尔科夫
  • 1篇马尔科夫模型
  • 1篇马尔可夫
  • 1篇马尔可夫模型
  • 1篇近邻法
  • 1篇计算机
  • 1篇计算机应用

机构

  • 3篇四川大学

作者

  • 3篇于中华
  • 3篇陈蓉
  • 3篇陈源
  • 3篇胡俊锋
  • 1篇陈浩
  • 1篇林霖
  • 1篇张靖波

传媒

  • 1篇计算机工程
  • 1篇计算机应用
  • 1篇中文信息学报

年份

  • 2篇2008
  • 1篇2007
3 条 记 录,以下是 1-3
排序方式:
基于加权投票K—近邻法的生物医学缩略语消歧被引量:3
2008年
生物医学文献信息抽取对充分挖掘利用生物医学领域取得的重要成果,促进生物医学的进一步发展具有重要意义。本文针对生物医学缩略语的分析理解问题,提出了基于加权投票K—近邻法的生物医学缩略语消歧算法。该算法基于"One Sense Per Discourse"假设自动生成带类标实例数据,消歧特征选用能表达文本主题的全局特征词,分类算法采用加权投票K—近邻法。在包含177762篇Medline摘要的真实语料上进行的实验表明,本文所提出的算法明显优于相关工作中的算法。此外,实验还表明,对于缩略语消歧,加权投票K—近邻法与经典K—近邻法相比,不但具有高的预测准确率,而且性能更加稳定。
于中华陈蓉胡俊锋陈源
关键词:计算机应用中文信息处理
一种松耦合的生物医学命名实体识别算法被引量:3
2007年
生物医学命名实体识别(Bio-NER)是生物医学文献挖掘利用的基础工作。针对目前Bio-NER存在的困难和问题,提出了松耦合的Bio-NER算法LCA,该算法利用启发规则过滤器、词性模板匹配及改良的隐马尔科夫模型(HMM)识别生物医学命名实体。在GENIA corpus3.02语料库上进行的实验表明,LCA可以达到80%的准确率和89%的召回率,优于相关工作中的结果。
胡俊锋陈蓉陈源陈浩于中华
关键词:隐马尔科夫模型
面向概括性小文本的文本分割算法被引量:1
2008年
文本分割是自然语言文本处理的一项重要研究内容。该文针对现有模型无法有效分割概括性小文本的不足,提出基于隐马尔可夫模型的统计算法。该算法利用小文本中各结构块的长度及词汇信息,对概括性小文本进行同一主题不同论述侧面的分割。对发射概率设计了基于句群和基于分割点2种不同的计算方法。以Medline摘要为样本进行的实验表明,该算法对概括性小文本分割是有效的,明显好于经典的TextTiling算法。
陈源陈蓉胡俊锋林霖张靖波于中华
关键词:文本分割隐马尔可夫模型
共1页<1>
聚类工具0