您的位置: 专家智库 > >

朱虹

作品数:4 被引量:6H指数:1
供职机构:北京大学信息科学技术学院计算语言学研究所更多>>
发文基金:国家自然科学基金国家重点基础研究发展计划国家社会科学基金更多>>
相关领域:自动化与计算机技术语言文字更多>>

文献类型

  • 2篇期刊文章
  • 2篇会议论文

领域

  • 3篇自动化与计算...
  • 2篇语言文字

主题

  • 3篇汉语
  • 2篇形容词
  • 2篇EM算法
  • 1篇多语
  • 1篇信息处理
  • 1篇形容
  • 1篇语形
  • 1篇语言处理
  • 1篇语言学
  • 1篇知识获取
  • 1篇数理语言学
  • 1篇中文
  • 1篇中文信息
  • 1篇中文信息处理
  • 1篇自然语言
  • 1篇自然语言处理
  • 1篇字处理
  • 1篇消歧
  • 1篇计算机
  • 1篇计算机应用

机构

  • 4篇北京大学

作者

  • 4篇朱虹
  • 4篇刘扬
  • 2篇贾玉祥
  • 1篇俞士汶

传媒

  • 1篇情报学报
  • 1篇中文信息学报
  • 1篇第四届全国学...
  • 1篇第四届全国学...

年份

  • 1篇2009
  • 3篇2008
4 条 记 录,以下是 1-4
排序方式:
词汇语义知识库的研究现状与发展趋势被引量:5
2008年
作为文本内容理解的媒介与载体,词汇语义知识库已被广泛应用于信息检索、信息提取、问答系统、自动文摘等方面,成为自然语言处理不可或缺的基础资源。本文介绍词汇语义知识库研究与开发的现状,重点分析了WordNet、SinicaBOW、HowNet及CCD等具有代表性的词汇语义知识库的具体情况。在此基础上,盘点各种需求和解决方案,提出词汇语义知识库研究面临新的挑战和机遇,即本体化和多语化的大趋势,它们将从不同方面弥补词汇语义知识库在知识共享和知识交流上的不足,使其更好地为自然语言处理服务。本文最后探讨了词汇语义知识库未来发展中可能存在的问题和新的课题。
朱虹刘扬
关键词:本体多语自然语言处理
汉语形容词的自动词义区分研究被引量:1
2009年
词义知识获取是词义知识库建设、词义消歧等任务的基础和起点,目前该工作基本依赖人类专家的智慧和洞察力,在大规模文本处理上缺乏意义计算的客观性和一致性。该文以汉语的中高频形容词为样本,深入挖掘词义特征并采用有参数初始化过程的EM迭代算法,实现了从真实文本中自动发现并区分词语词义的过程。该词义区分算法选取易获取的词形特征、基于大规模语料的搭配特征、基于网络语料的属性—宿主关系特征,替代以往难以获取的句法结构特征,并进一步利用HowNet优化了词形特征的选择。该工作可以应用于信息检索等领域,能够对现有词典起到修改和补充的作用,该思路亦可扩展到其他汉语词类上去。
朱虹刘扬俞士汶
关键词:计算机应用中文信息处理知识获取EM算法
基于混合特征的汉语形容词词义区分研究
词义知识获取问题是词义消歧、词义知识库建设、语料库建设等不同研究的瓶颈问题。本文提出的基于混合特征的词义区分方法,通过发现并抽取易于获取的词义特征,结合EM迭代算法,能够很好地对汉语高频形容词实现词义区分。比较于不同的特...
朱虹贾玉祥刘扬
关键词:形容词EM算法
文献传递
基于混合特征的汉语形容词词义区分研究
词义知识获取问题是词义消歧、词义知识库建设、语料库建设等不同研究的瓶颈问题。本文提出的基于混合特征的词义区分方法,通过发现并抽取易于获取的词义特征,结合EM迭代算法,能够很好地对汉语高频形容词实现词义区分。比较于不同的特...
朱虹贾玉祥刘扬
关键词:汉字处理词义消歧数理语言学
文献传递
共1页<1>
聚类工具0