张小衡
- 作品数:31 被引量:173H指数:4
- 供职机构:香港理工大学更多>>
- 发文基金:香港理工大学研究基金更多>>
- 相关领域:自动化与计算机技术语言文字文化科学经济管理更多>>
- 也谈汉语书面语的分词问题——分词连写十大好处被引量:22
- 1998年
- 单词的切分对现代汉语的运用、研究和计算机信息处理等都具有相当重要的意义。本文阐述书面汉语分词连写的十大好处,并讨论一些实施方面的问题。文章全文分词连写。
- 张小衡
- 关键词:汉语书面语分词连写分词计算机信息处理
- 《信息处理用GB13000.1字符集汉字部件规范》在输入法应用中的难点讨论被引量:10
- 2004年
- 《信息处理用GB1 30 0 0 1字符集汉字部件规范》对于规范汉字形码输入法具有非常重要的意义。然而 ,在实际运用上却存在着部件数量太大 ,部件定义难以操作 ,部件拆分组合不易掌握等难处。造成困难的原因主要有 :(1 )基础部件主要靠列表来确定 ,(2 )部件强调按理切分和成字组合 ,(3)过多依赖“组字能力”的判别 ,(4 )过分注重部件数量的限制。要走出“难”的困境 ,应该在现有规范的基础上根据汉字的形态特征制定出简便可靠的部件识别规则和切分规则。实验证明 。
- 张小衡
- 关键词:计算机应用中文信息处理汉字输入汉字部件
- 从“qinghuadaxue”谈起逐步实现中文智能输入被引量:1
- 1996年
- 张小衡
- 关键词:汉字输入计算机
- 粤-普机器翻译中的词处理被引量:2
- 1999年
- 粤语和普通话之间的机器翻译研究应首先考虑由粤语到普通话的书面语翻译,并以单词为突破口。本文重点讨论粤-普书面语机器翻译中的词处理,尤其是方言词处理,包括方言词的识别和方言词的翻译两方面,同时介绍一个已经初步实现了的单词级粤-普机器翻译试验系统。文章最后将给出结论和讨论。
- 张小衡
- 关键词:机器翻译粤语普通话词处理汉语
- WebQLd的新进展及其在中文教学中的应用
- 本文首先讨论多项选择题和WebQLd2006课件制作工具的局限性,接着介绍新版的WebQLd2010如何在方法上和软件实现上有效地解决这些问题。两个版本之间的重要进展包括:①将传统多项选择题的单层结构发展成可自由附加填空...
- 张小衡
- 关键词:多项选择题填空题
- 《全衡》网上中文输入系统—功能与特性
- 在广泛使用普通话的中国内地和台湾,前者单用简体字,后者单用繁体字,两地的汉字输入问题己经得到较好的解决,因此很多人不再热中于这方面的研究.然而对于香港和国际上的中文电脑用户来说,这个问题还没有得到令人满意的解决.于是我们...
- 张小衡
- 关键词:信息检索
- 一个支持人工校对的中文简繁体转换工具
- 中文简繁体自动转换是当今社会的一大需求。由于计算机技术还远远不能保证译文的100%准确,因而为了提供高质量译文人工校对是不可或缺的。本文报道了一个既能作中文简繁体自动转换,又支持人工校对的应用软件工具。该软件的自动转换正...
- 张小衡
- 关键词:繁体字简体字
- 文献传递
- 中文机构名称的识别与分析被引量:124
- 1997年
- 中文机构名称数目庞大,层出不穷,绝大多数未能收入词典,给自然语言处理带来困扰。但是,从语言学的角度来看,机构名称是一种偏正复合式专有名词,同时又是一类较为简单的偏正名词词组,有自己的结构规律和形态标记。本文以高校名称为重点,以中国内地、香港和台湾三地实际语料为依据,从语言学和计算机技术两方面对机构名称的识别与分析展开讨论,并总结出相应的规则。根据这些规则,对六百多万字的三地语料库作高校名称识别,正确率(指前后界定位均正确)达973%,召回率为969%。这些规则还可应用于拼音汉字智能转换和机器翻译等其它领域。
- 张小衡王玲玲
- 关键词:专有名词自然语言处理信息处理
- 字形的“号制”“点制”与“米制”被引量:1
- 2006年
- 号制和点制是计算机文字处理中表示字形尺寸的最常用标准。论文简单叙述这两种标准的历史和现状,给出一个含Word2003所有字号的“号-点-厘米”对照表,并介绍对照表数据的实验获取方法和多种用途。最后,在深入分析讨论号制和点制的种种缺陷的基础上提出字形度量全球统一使用米制的构想。
- 张小衡
- 关键词:米制
- 计算机汉字简繁体转换有待解决的问题
- 现代中文教学,尤其是基础语文教学一直以来都很重视简体字和繁体字的规范书写和正确转换。目前计算机汉字简繁体转换的正确率已达到99%以上,但仍存在不少有待完善的空间。本文结合实例分析讨论六类问题,包括错别字问题、异体字问题、...
- 张小衡
- 关键词:简体字繁体字规范字异体字汉字转换