您的位置: 专家智库 > >

丁彬

作品数:2 被引量:3H指数:1
供职机构:苏州大学计算机科学与技术学院更多>>
发文基金:国家自然科学基金国家高技术研究发展计划国家教育部博士点基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 1篇语义
  • 1篇篇章
  • 1篇最大熵
  • 1篇最大熵分类器
  • 1篇显式
  • 1篇后缀
  • 1篇汉语
  • 1篇分类器

机构

  • 2篇苏州大学

作者

  • 2篇周国栋
  • 2篇丁彬
  • 1篇孔芳
  • 1篇孙静
  • 1篇方艳
  • 1篇李生

传媒

  • 2篇中文信息学报

年份

  • 2篇2014
2 条 记 录,以下是 1-2
排序方式:
利用扩展标记集的词结构分析被引量:2
2014年
该文给出了一种与传统分词不同的词法分析选择,提出了一种利用扩展标记集来实现词内部结构分析的方法。首先阐述了词的内部结构特点,把结构中的前后缀视为特殊的词,进而通过识别出每一个词的前后缀来识别词的内部结构。方法是把词内部结构识别问题转换成序列标注问题,通过扩展标记集,采用CRF模型来实现词的内部结构分析。最终实验表明,无论是在总体性能上,还是在各层结构的识别上都取得了较高的准确度。
孙静方艳丁彬周国栋
汉语显式篇章关系分析被引量:1
2014年
篇章关系分为显式和隐式两种。显式关系的显著特征是篇章的基本单元之间存在显式连接词。针对汉语显式篇章关系,构建了包括汉语连接词识别和篇章关系分类的显式篇章关系分析平台。该文选取汉语宾州树库(Chinese Penn Treebank,CTB)中的500篇文本进行了汉语显式篇章关系标注;结合连接词的中心词,采用最大熵分类器构建了汉语连接词识别模块,其性能F1值达到了66.79%;基于连接词及其词性等上下文特征,构建了篇章关系分类器,其在最顶层4大类语义关系上的分类性能的F1值为91.92%。
丁彬孔芳李生周国栋
关键词:最大熵分类器
共1页<1>
聚类工具0