中国科学院知识创新工程青年人才领域前沿项目(O754021432)
- 作品数:12 被引量:18H指数:2
- 相关作者:张全缪建明韦向峰贾宁臧翰芬更多>>
- 相关机构:中国科学院中国科学院研究生院更多>>
- 发文基金:中国科学院知识创新工程青年人才领域前沿项目中国科学院声学研究所知识创新工程项目国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术语言文字文化科学更多>>
- 基于汉语字义基元化的新词处理分析
- 2010年
- 现代汉语中具有"字义基元化,词义组合化"的特点,本文根据这一特点,从汉字动态组合形成新词的角度,对汉语中新词语的释义进行了分析。通过对比词典收录的词语义项和新词语释义,发现字义在网络环境出现的新词中有了拓展。针对这些义项进一步分析发现,字义的核心语义内容没有发生根本的变化,而是表述对象的拓展。本文以组成网络新词比较活跃的"裸"字为例进行了具体说明,研究结果有助于汉语新词处理。
- 张全袁毅
- 关键词:新词语词汇语义语义分析
- 基于HNC理论的汉语辅语义块自动辨识研究被引量:2
- 2009年
- 全自动的语义分析一直是自然语言处理的主要目标之一,通过深层语义的分析,自然语言可以转化为形式语言。因此,可以实现人机之间的交互。为达到此目的人们在语义分析和标注方面做了长期的努力。本文在借鉴前人工作的基础上,为提高辅语义块的自动识别,进行了大量的语料分析,总结提出了比较有效的计算机处理规则。经真实文本实验测试,利用这些规则处理,可以达到较好的准确率和召回率。
- 臧翰芬韦向峰张全
- 利用语句结构信息的机器翻译自动评测初探
- 2010年
- 机器翻译评测对机器翻译有着极其重要的意义,它对翻译系统性能的提高做出了很大的贡献,同时促进了机器翻译的发展。本文在HNC机器翻译策略的基础上,对翻译语料的句类转换和句式转换做了初步的研究,并利用句类转换和句式转换的理论,建立了基于句类信息的自动评测的打分机制。
- 丁泽亚张全缪建明池毓焕臧翰芬
- 关键词:句类转换句式转换
- 面向汉英机器翻译的大句范式初探
- 在大句的范围内小句的组织结构会呈现某些特定的模式,即大句范式。而范式的运用存在着语种间的有无或常用罕用之别,需要在翻译时予以变换。本文初步探讨了汉英机器翻译面临的几个常用大句范式,描述其辨识特征,并提出转换规则,以期对现...
- 池毓焕李颖
- 关键词:汉英机器翻译
- 文献传递
- 利用地名用字分析的中文地名识别处理被引量:7
- 2009年
- 对中文地名未登录词识别而言,首先充分挖掘地名用字本身的特征,及其上下文用字的特征,其次通过最大熵模型把这些来源不同的知识整合。在特征选择和知识获取时,通过对中文地名这个特定群体进行针对性分析,得到了更多的信息,如中文地名更常用哪些字以及这些字如何搭配更常见等。最终使得系统在真实语料的封闭测试和开放测试中分别达到了F值87%和83%的较好效果。
- 李诺张全
- 关键词:中文地名识别最大熵
- 现代汉语句群处理研究的进展
- 2009年
- 句群是HNC对段落、篇章处理时在句子和段落之间加上的一个过渡层次,句群的理解结果直接影响篇章理解的准确率。本文结合HNC理论对现代汉语句群处理的最新研究成果,对句群的形式化框架进行了详细地阐述,最终形成了句群处理结果的新方式。最后,通过真实语料的验证,证明这一表述方式有效且可行。
- 缪建明张全
- 关键词:语境句群
- 面向智能搜索的文本语义概念计算被引量:1
- 2011年
- 面对互联网上的海量信息资源,搜索引擎已经成为重要的工具。使搜索引擎具备更高的智能,为用户提供更好的服务已经成为这一领域发展的趋势。语义计算是实现智能搜索的重要环节。本文在介绍概念层次网络(HNC)语义计算的基础上,探讨了在搜索中引入HNC语义计算增强搜索智能的处理模式。同时作为一项处理电子文本的基础技术,HNC语义计算的应用不止在智能搜索,它在诸如计算社会学等新兴学科中扮演着重要角色,还为保证网站信息安全发挥重要的作用。
- 张全袁毅
- 关键词:智能搜索信息检索语义计算
- 中文词语倾向性分析处理被引量:6
- 2009年
- 意见挖掘是自然语言处理研究领域的一个新热点。词语倾向性的判定是意见挖掘的基础和重要环节。该文进行了中文词语倾向性的自动判定实验。实验中采用了《现代汉语褒贬用法词典》中的词语做为褒贬判定的核心词汇,以同义词词典扩展了褒贬义词典的词语,并使用二元语法模型来判定多倾向性词语的倾向。实验结果褒义词的F-Score为79.31%,贬义词的F-Score为78.18%。
- 李娟张全贾宁
- 关键词:二元语法
- 基于概念基元的句群情景框架抽取研究被引量:1
- 2010年
- 句群的构成要素是领域、情景和背景,领域是核心。领域关联的情景框架主要依据领域句类知识库的描述,从句群语句的语义块中抽取。本文介绍了在语言概念空间中对句群情景框架的概念符号描述,通过匹配整合句群情景框架中语义块的概念约束和句类分析结果中的语义块,给出了从自然语言空间的句群中抽取情景框架要素的方法,并根据实验结果总结了句群情景框架抽取中需要加强和完善的地方。
- 韦向峰缪建明张全池毓焕
- 关键词:句群语义块句类分析
- 一种基于概念关联式的词义消岐方法被引量:1
- 2010年
- 词义排岐是自然语言处理中最关键也是最困难的问题之一,至今仍没有得到完全有效的解决。在研究HNC表达汉语知识的基础上,提出了一种基于概念关联式的汉语词义消歧方法,用于处理汉语的歧义字段。该方法综合了词语概念的层次性、网络性、结构性特征,用一种统一的表示式来规范这类特征,解决了多个不同概念之间的知识关联表示问题。实验对20个汉语高频多义词进行了测试,平均正确率为94%,验证了该方法的有效性。
- 缪建明张全
- 关键词:HNC理论