您的位置: 专家智库 > >

张国清

作品数:4 被引量:48H指数:2
供职机构:上海师范大学计算中心更多>>
发文基金:山西省自然科学基金山西省青年科技研究基金山西省回国留学人员科研经费资助项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇期刊文章
  • 1篇会议论文

领域

  • 3篇自动化与计算...

主题

  • 3篇语言处理
  • 3篇自然语言
  • 3篇自然语言处理
  • 2篇汉语
  • 1篇信息抽取
  • 1篇义类
  • 1篇语词
  • 1篇语料
  • 1篇语料库
  • 1篇语义
  • 1篇知网
  • 1篇神经网
  • 1篇神经网络
  • 1篇类信息
  • 1篇基于神经网络
  • 1篇计算机
  • 1篇汉语词
  • 1篇汉语词义
  • 1篇汉语语义
  • 1篇抽取

机构

  • 4篇山西大学
  • 2篇上海师范大学

作者

  • 4篇张永奎
  • 4篇张国清
  • 1篇杨尔弘

传媒

  • 2篇计算机研究与...
  • 1篇计算机工程
  • 1篇第五届中国人...

年份

  • 2篇2001
  • 1篇1999
  • 1篇1998
4 条 记 录,以下是 1-4
排序方式:
一种基于神经网络的词义排歧方法被引量:1
2001年
从神经网络的基本原理和自动词义排歧的技术入手,阐明应用神经网络技术进行汉语词义排歧研究的基本方法和步骤,并给出了实验结果和分析。
张国清张永奎
关键词:自然语言处理神经网络计算机
基于义原同现频率的汉语词义排歧方法被引量:42
2001年
词义排岐是自然语言处理的重点和难点问题之一 .基于语料库的统计方法已被广泛地应用于词义排岐 .大多数的统计方法都受到数据稀疏的困扰 ,对于词义排岐而言 ,由于有大量同义词的存在 ,数据稀疏问题变得更为严重 .充分利用“知网”这个知识源的特性 ,提出了一种基于义原同现频率的词义排岐方法 ,在很大程度上克服了数据稀疏问题 .此外 ,该方法还避免了繁重的人工标注语料的过程 ,通过在一个约 10万字的语料库上获得义原同现频率矩阵 ,并以此作为词义排岐的依据 .实验表明 。
杨尔弘张国清张永奎
关键词:自然语言处理知网语料库
基于义类同现频率的汉语语义排歧方法被引量:7
1999年
义类标注是信息检索和自然语言处理中的一个重要问题.但依靠人工对义类进行标注不仅是一个十分烦琐的工作,而且很难把握标准.因此,对义类代码自动标注的研究就显得尤为迫切,而要实现自动标注,必须解决多义词排歧这一重要问题.在对《现代汉语词典》(以下简称《词典》)的义类标注过程中,文中通过统计相邻词语义类组合串的出现频率构造了一个同现频率矩阵集.这一同现频率矩阵集充分利用了义类体系的层次结构,极大地减少了数据稀疏和数据冗余.在此基础上,对《词典》中的多义词进行了排歧,结果较为满意.
张永奎张国清
关键词:自然语言处理
一种从词典释义文本中抽取词汇义类信息的算法
张永奎张国清
关键词:信息抽取
共1页<1>
聚类工具0