张国清
- 作品数:4 被引量:48H指数:2
- 供职机构:上海师范大学计算中心更多>>
- 发文基金:山西省自然科学基金山西省青年科技研究基金山西省回国留学人员科研经费资助项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种基于神经网络的词义排歧方法被引量:1
- 2001年
- 从神经网络的基本原理和自动词义排歧的技术入手,阐明应用神经网络技术进行汉语词义排歧研究的基本方法和步骤,并给出了实验结果和分析。
- 张国清张永奎
- 关键词:自然语言处理神经网络计算机
- 基于义原同现频率的汉语词义排歧方法被引量:42
- 2001年
- 词义排岐是自然语言处理的重点和难点问题之一 .基于语料库的统计方法已被广泛地应用于词义排岐 .大多数的统计方法都受到数据稀疏的困扰 ,对于词义排岐而言 ,由于有大量同义词的存在 ,数据稀疏问题变得更为严重 .充分利用“知网”这个知识源的特性 ,提出了一种基于义原同现频率的词义排岐方法 ,在很大程度上克服了数据稀疏问题 .此外 ,该方法还避免了繁重的人工标注语料的过程 ,通过在一个约 10万字的语料库上获得义原同现频率矩阵 ,并以此作为词义排岐的依据 .实验表明 。
- 杨尔弘张国清张永奎
- 关键词:自然语言处理知网语料库
- 基于义类同现频率的汉语语义排歧方法被引量:7
- 1999年
- 义类标注是信息检索和自然语言处理中的一个重要问题.但依靠人工对义类进行标注不仅是一个十分烦琐的工作,而且很难把握标准.因此,对义类代码自动标注的研究就显得尤为迫切,而要实现自动标注,必须解决多义词排歧这一重要问题.在对《现代汉语词典》(以下简称《词典》)的义类标注过程中,文中通过统计相邻词语义类组合串的出现频率构造了一个同现频率矩阵集.这一同现频率矩阵集充分利用了义类体系的层次结构,极大地减少了数据稀疏和数据冗余.在此基础上,对《词典》中的多义词进行了排歧,结果较为满意.
- 张永奎张国清
- 关键词:自然语言处理
- 一种从词典释义文本中抽取词汇义类信息的算法
- 张永奎张国清
- 关键词:信息抽取