王洁
- 作品数:14 被引量:57H指数:3
- 供职机构:暨南大学华文学院更多>>
- 发文基金:国家自然科学基金教育部科学技术研究重点项目教育部人文社会科学重点研究基地度重大研究项目更多>>
- 相关领域:语言文字自动化与计算机技术文化科学更多>>
- 华文水平测试词汇大纲研制的理念与程序
- 2020年
- 文章首先明确汉字大纲和词汇大纲的分工;然后基于词频得到词语底表,经过删除、补充、修改、合并、拆分等操作得到大纲条目,并参照相关词汇大纲进一步完善,完成条目收录工作;最后基于作文语料库、教材语料库的相关数据,采用算法自动定级加人工干预调整定级的方式,经过3次定级完成条目定级工作。
- 王洁
- 关键词:词汇大纲
- 汉语中介语偏误的计算机处理方法研究
- 本文的研究目标是让计算机辅助人来处理汉语中介语中的偏误。辅助的方式有四种:偏误的自动识别及提示;偏误的交互式识别及提示;偏误的自动标注;偏误标注的自动管理和检索。其中自动识别及提示的智能性最高,是本文研究的重点,其处理过...
- 王洁
- 关键词:中介语偏误偏误分析
- 文献传递
- 现代汉语多音词自动标音研究
- 汉语多音词自动标音的研究可以为语音合成、汉语教学及音字转换评测等领域服务。
本文采用N元文法的统计方法对现代汉语中的多音词进行自动标音。N元文法方法存在的一个突出问题是数据稀疏,而现有的解决数据稀疏的平滑方法并...
- 王洁
- 关键词:多音词相似词数据稀疏现代汉语语音学信息处理
- 文献传递
- 现代汉语多音词自动标音研究
- 汉语多音词自动标音的研究可以为语音合成及汉语教学等领域服务。本文采用N元模型的统计方法对现代汉语中的多音词进行自动标音,通过引入相似词,采取“词形-相似词-词性”三步回退的策略,缓解了数据稀疏问题,实验结果说明这个方法是...
- 王洁荀恩东罗智勇宋柔
- 关键词:多音词数据稀疏相似词
- 文献传递
- 现代汉语多音词自动标音研究
- 汉语多音词自动标音的研究可以为语音合成及汉语教学等领域服务.本文采用N元模型的统计方法对现代汉语中的多音词进行自动标音,通过引入相似词,采取'词形-相似词-词性'三步回退的策略,缓解了数据稀疏问题,实验结果说明这个方法是...
- 王洁荀恩东罗智勇宋柔
- 关键词:多音词数据稀疏相似词
- 文献传递
- HSK动态作文语料库偏误标注方法研究
- HSK动态作文语料库是一个大规模的汉语中介语语料库,人工对其中各类偏误进行了标注。针对人工标注的缺陷,本文提出了偏误自动标注的方法。基于编辑距离算法,以汉语的词为单位通过进一步求解编辑路径发现修正原句所需要的基本编辑操作...
- 王洁宋柔
- 关键词:偏误
- 文献传递
- 汉语书面语体庄雅度的自动测量被引量:46
- 2008年
- 文章以汉语书面语体理论"韵律语法"为基础,首先介绍了汉语书面语体的庄雅特征,如嵌偶词、合偶词、书面语句型等;其次给出了庄雅特征的量化方法及庄雅度自动测量的方法;再次通过HSK(高等)考试作文的语料验证了庄雅度计算结果的可靠性;最后讨论了庄雅度自动测量技术的应用领域并指出其现实及潜在意义之所在。
- 冯胜利王洁黄梅
- 《中国大百科全书》人物传记知识提取加工规范
- 将百科辞典中的知识形式化,是使用计算机进行知识服务的根本基础。目前的主要方法是在人工建立语言知识库的基础上计算机对于词条释文进行句法语义分析,或者直接由知识专家对词条释文进行形式化改写。这两种方法都需要大量的高级人力的投...
- 颜伟王洁尚英宋柔
- 关键词:人物传记知识提取
- 文献传递
- 计算机识别汉语语法偏误的可行性分析被引量:4
- 2011年
- 针对目前汉语中介语偏误人工标注缺乏一致性的问题,本文提出了计算机识别偏误的方法。首先参照《外国人学汉语语法偏误分析》一书中的类别体系,对计算机识别各类语法偏误的可行性进行了理论上的分析;然后基于规则方法,选择"比"字句、"把"字句、"被"字句三种特殊句型作为切入点进行了实验验证。经过面的分析和点的验证,得出结论:在偏误标注方面,计算机能够在一定程度上自动识别一些类型的语法偏误,其目标是辅助人工标注而非完全代替人,能较好地保证标注结果的一致性。
- 王洁
- 关键词:中介语语料库偏误
- “把”字句核心动词的计算机辅助发现及合法性判断研究
- “把”字句是现代汉语中十分常用的一种特殊句式,其核心动词一般含有处置或支配的意义。外国或外族的汉语学习者在使用“把”字句时最常犯的一种错误是使用了非法的核心动词。本文探讨“把”字句核心动词的计算机辅助发现方法,针对教师教...
- 王洁田旭红宋柔
- 关键词:核心动词