石民
- 作品数:6 被引量:80H指数:2
- 供职机构:南京师范大学文学院更多>>
- 发文基金:国家教育部“211”工程国家自然科学基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- 基于CRF的汉语动词“像”的比喻义识别
- 汉语隐喻计算是一项难度很大的工作,明喻由于带有明显的比喻标志(比喻词),成为一种较理想的用于计算机自动处理的比喻类型。本文着力于对动词“像”的比喻义自动识别,首先,利用程序提取出语料库中带有动词“像”的句子,人工判断是否...
- 李斌于丽丽石民
- 关键词:汉字处理数理语言学
- 文献传递
- 基于CRF的汉语动词“像”的比喻义识别
- 汉语隐喻计算是一项难度很大的工作,明喻由于带有明显的比喻标志(比喻词),成为一种较理想的用于计算机自动处理的比喻类型。本文着力于对动词"像"的比喻义自动识别,首先,利用程序提取出语料库中带有动词"像"的句子,人工判断是否...
- 李斌于丽丽石民
- 关键词:自然语言处理
- 文献传递
- “像”的明喻计算被引量:8
- 2008年
- 汉语隐喻计算是一项难度很大的工作,明喻由于带有明显的标志(比喻词)成为计算机自动识别的基础类型。该文着力于典型的比喻词"像"的比喻义及相关比喻成分的自动识别。首先,人工标注了1 586句语料,分析了明喻句的基本特点。然后,使用最大熵模型对"像"的比喻义和非比喻义进行分类,开放测试F值达到了89%。最后,用条件随机场模型识别出比喻的本体、喻体和相似点,F值分别达到了73%、86%和83%。
- 李斌于丽丽石民曲维光
- 关键词:计算机应用中文信息处理
- 先秦汉语自动分词及词性标注研究
- 自动分词和词性标注是中文信息处理的基础性工作,至今已有二三十年的历史。在现代汉语领域已经取得了令人瞩目的技术成果,但在古代汉语领域则研究甚少,有许多问题尚待解决,如古汉语双音节词的判定、高效实用的古汉语语料加工软件等。本...
- 石民
- 关键词:先秦汉语自动分词词性标注语言学
- 文献传递
- 基于CRF的古汉语分词标注一体化研究
- 本文在计算机自然语言处理和古代汉语、特别是先秦文献的交叉领域进行了新的探索。首先对《左传》文本进行了词汇处理(分词和词性标注)和分析,然后采用条件随机场模型(CRF),基于两个模板进行自动分词、词性标注、分词标注一体化的...
- 石民陈小荷于丽丽李斌
- 关键词:古汉语分词词性标注左传
- 文献传递
- 基于CRF的先秦汉语分词标注一体化研究被引量:71
- 2010年
- 该文探索了古代汉语,特别是先秦文献的词切分及词性标注。首先对《左传》文本进行了词汇处理(分词和词性标注)和考察分析,然后采用条件随机场模型(CRF),进行自动分词、词性标注、分词标注一体化的对比实验。结果表明,一体化分词比单独分词的准确率和召回率均有明显提高,开放测试的F值达到了94.60%;一体化词性标注的F值达到了89.65%,比传统的先分词后标注的"两步走"方法有明显提高。该项研究可以服务于古代汉语词汇研究和语料库建设,以弥补人工标注的不足。
- 石民李斌陈小荷
- 关键词:中文信息处理先秦汉语词性标注左传条件随机场模型