您的位置: 专家智库 > >

石民

作品数:6 被引量:80H指数:2
供职机构:南京师范大学文学院更多>>
发文基金:国家教育部“211”工程国家自然科学基金国家重点基础研究发展计划更多>>
相关领域:自动化与计算机技术语言文字更多>>

文献类型

  • 3篇会议论文
  • 2篇期刊文章
  • 1篇学位论文

领域

  • 5篇自动化与计算...
  • 2篇语言文字

主题

  • 5篇汉语
  • 4篇CRF
  • 3篇词性
  • 3篇词性标注
  • 2篇动词
  • 2篇信息处理
  • 2篇语言学
  • 2篇喻义
  • 2篇随机场
  • 2篇随机场模型
  • 2篇条件随机场
  • 2篇条件随机场模...
  • 2篇中文
  • 2篇中文信息
  • 2篇中文信息处理
  • 2篇左传
  • 2篇先秦汉语
  • 2篇汉语动词
  • 2篇分词
  • 2篇比喻

机构

  • 6篇南京师范大学

作者

  • 6篇石民
  • 4篇于丽丽
  • 4篇李斌
  • 2篇陈小荷
  • 1篇李斌
  • 1篇曲维光

传媒

  • 2篇中文信息学报
  • 1篇第四届全国学...

年份

  • 2篇2010
  • 1篇2009
  • 3篇2008
6 条 记 录,以下是 1-6
排序方式:
基于CRF的汉语动词“像”的比喻义识别
汉语隐喻计算是一项难度很大的工作,明喻由于带有明显的比喻标志(比喻词),成为一种较理想的用于计算机自动处理的比喻类型。本文着力于对动词“像”的比喻义自动识别,首先,利用程序提取出语料库中带有动词“像”的句子,人工判断是否...
李斌于丽丽石民
关键词:汉字处理数理语言学
文献传递
基于CRF的汉语动词“像”的比喻义识别
汉语隐喻计算是一项难度很大的工作,明喻由于带有明显的比喻标志(比喻词),成为一种较理想的用于计算机自动处理的比喻类型。本文着力于对动词"像"的比喻义自动识别,首先,利用程序提取出语料库中带有动词"像"的句子,人工判断是否...
李斌于丽丽石民
关键词:自然语言处理
文献传递
“像”的明喻计算被引量:8
2008年
汉语隐喻计算是一项难度很大的工作,明喻由于带有明显的标志(比喻词)成为计算机自动识别的基础类型。该文着力于典型的比喻词"像"的比喻义及相关比喻成分的自动识别。首先,人工标注了1 586句语料,分析了明喻句的基本特点。然后,使用最大熵模型对"像"的比喻义和非比喻义进行分类,开放测试F值达到了89%。最后,用条件随机场模型识别出比喻的本体、喻体和相似点,F值分别达到了73%、86%和83%。
李斌于丽丽石民曲维光
关键词:计算机应用中文信息处理
先秦汉语自动分词及词性标注研究
自动分词和词性标注是中文信息处理的基础性工作,至今已有二三十年的历史。在现代汉语领域已经取得了令人瞩目的技术成果,但在古代汉语领域则研究甚少,有许多问题尚待解决,如古汉语双音节词的判定、高效实用的古汉语语料加工软件等。本...
石民
关键词:先秦汉语自动分词词性标注语言学
文献传递
基于CRF的古汉语分词标注一体化研究
本文在计算机自然语言处理和古代汉语、特别是先秦文献的交叉领域进行了新的探索。首先对《左传》文本进行了词汇处理(分词和词性标注)和分析,然后采用条件随机场模型(CRF),基于两个模板进行自动分词、词性标注、分词标注一体化的...
石民陈小荷于丽丽李斌
关键词:古汉语分词词性标注左传
文献传递
基于CRF的先秦汉语分词标注一体化研究被引量:71
2010年
该文探索了古代汉语,特别是先秦文献的词切分及词性标注。首先对《左传》文本进行了词汇处理(分词和词性标注)和考察分析,然后采用条件随机场模型(CRF),进行自动分词、词性标注、分词标注一体化的对比实验。结果表明,一体化分词比单独分词的准确率和召回率均有明显提高,开放测试的F值达到了94.60%;一体化词性标注的F值达到了89.65%,比传统的先分词后标注的"两步走"方法有明显提高。该项研究可以服务于古代汉语词汇研究和语料库建设,以弥补人工标注的不足。
石民李斌陈小荷
关键词:中文信息处理先秦汉语词性标注左传条件随机场模型
共1页<1>
聚类工具0