张丽静
- 作品数:4 被引量:16H指数:2
- 供职机构:大连理工大学计算机科学与技术学院计算机科学与工程系更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- 统计和规则相结合的中文机构名称识别
- 中文机构名称是专名的一种,量大且层出不穷,因而大多不能收入词典,这便给自然语言处理,尤其是机器翻译和机器理解带来很大困扰.本文将统计和规则两种方法结合起来,建立了中文机构名称的识别模型.系统闭式精确率和召回率分别达92....
- 张艳丽黄德根张丽静杨元生
- 规则与统计相结合的兼类词处理机制被引量:12
- 2003年
- 兼类词处理是词性标注的关键所在 ,本文对兼类词排岐进行了研究 ,介绍了规则和统计相结合的排岐策略 .按照上述策略 ,实现了一个兼类词处理系统 .实验测试结果表明 ,利用规则与统计相结合的兼类词处理机制可以有效地提高排岐正确率和词性标注正确率 ,在封闭测试和开放测试中兼类词的排歧正确率分别达到了 93.91%和 91.16 % ,标注正确率分别达到了 97.85 %和 96 .71% .
- 黄德根张丽静张艳丽杨元生
- 关键词:词性标注兼类词
- 基于统计的汉语词性标注规则的获取技术
- 规则库的建立是基于规则的词性标注方法的基础.本文介绍了一种基于统计的汉语词性标注规则的获取方法.文中运用统计方法从已经标注好词性的30万语料中自动获取规则,并通过测试语料检验规则的正确性.将获取的规则用于词性标注系统中,...
- 张丽静黄德根
- 关键词:词性标注语料库
- 文献传递
- 规则与统计相结合的兼类词处理机制
- 词性标注是自然语言处理中的一项基础性课题,词性标注的正误对汉语语料库标注、机器翻译和大规模文本的信息检索等都有重要的意义.该文对词性标注的方法进行了研究,分析了基于规则的方法和基于统计的方法的优缺点.在此基础上提出了规则...
- 张丽静
- 关键词:词性标注兼类词
- 文献传递