您的位置: 专家智库
>
资助详情>
国家重点基础研究发展计划(2004CB318104)
国家重点基础研究发展计划(2004CB318104)
- 作品数:45 被引量:177H指数:7
- 相关作者:张全缪建明吴晨韦向峰贾宁更多>>
- 相关机构:中国科学院中国科学院研究生院中国科学院大学更多>>
- 发文基金:国家重点基础研究发展计划中国科学院声学研究所知识创新工程项目中国科学院知识创新工程青年人才领域前沿项目更多>>
- 相关领域:自动化与计算机技术文化科学语言文字更多>>
- 语义理解下的自然语言处理及信息检索模型被引量:7
- 2008年
- 本文从如何利用语义来构建理想信息检索系统的角度出发,以HNC自然语言理解体系为基础,给出了一种在这一体系下分步构建信息检索系统的实施方案。结合HNC在信息检索方面新近取得的研究成果,从理论和工程两个角度介绍了这一体系服务于信息检索的相关内容,讨论了其中几个重要模型的实现方法。最后沿着方案思路给出了在目前成果基础上进一步发展检索系统的展望。
- 吴晨张全缪建明韦向峰
- 关键词:信息检索自然语言理解语义HNC
- 跨语种信息检索中的文本比较及结果生成算法被引量:1
- 2005年
- 提出了一种基于语义的跨语种信息检索中的文本比较及结果生成的算法,算法从语义入手,以形式化的语境单元框架结构来表示被检索的内容和检索请求,它从文本语义表示的三个方面:领域(静态范畴)、情景(动态范畴)、背景(参照)来对检索请求和被检索文档数据之间的语义相关度进行计算和排序,根据建立在语境单元框架上的语义符号间的匹配和生成机制来实现文本检索。与传统CLIR技术相比,它可以避免以语言空间中的词语作为检索的中间量而带来的语义模糊。实验证明,这一算法在解决基于语义的跨语种信息检索中的文本比较和结果生成上具有良好的处理能力。
- 吴晨缪建明张全
- 关键词:语义相关度
- 基于领域句类的句群处理研究
- 知识支持的好坏直接对于句群处理的实现起到举足轻重的作用。本文介绍了在 HNC 语义网络基础上,通过使用领域句类的知识表示方法,实现句群语境信息的有效提取,最终完成句群处理的方法。最后, 通过实例句群,说明这种方法有助于自...
- 缪建明张全
- 利用语句结构信息的机器翻译自动评测初探
- 2010年
- 机器翻译评测对机器翻译有着极其重要的意义,它对翻译系统性能的提高做出了很大的贡献,同时促进了机器翻译的发展。本文在HNC机器翻译策略的基础上,对翻译语料的句类转换和句式转换做了初步的研究,并利用句类转换和句式转换的理论,建立了基于句类信息的自动评测的打分机制。
- 丁泽亚张全缪建明池毓焕臧翰芬
- 关键词:句类转换句式转换
- HNC问答处理系统关键算法研究被引量:2
- 2006年
- HNC问答处理系统是一种崭新的问答处理模式,与传统的问答处理系统相比,它把对语言的处理深入到语言概念空间中进行,以求尽可能地减少语言中的同义和多义模糊。本文在介绍HNC问答处理系统整体构架的同时,设计和实现了问答系统中的3个关键算法,服务于问答系统的不同阶段处理需要。实际应用表明,在这些算法指导下的HNC问答处理系统具有良好的问题处理能力。
- 吴晨张全
- 关键词:中文信息处理语言概念空间语义相关度HNC理论
- 基于句类向量空间模型的自动文本分类研究被引量:10
- 2007年
- 向量空间模型是自动文本分类中成熟的文本表示模型,通常以词语或短语作为特征项,但这些特征项通常只能提供较少的局部语义信息。为实现基于内容的文本分类,该文用HNC理论中的句类作为特征项,通过混合句类分解等技术对句类向量空间降维,使用tfc算法对特征项进行权重计算,用KNN算法进行分类。该分类器的平均准确率和召回率都是可接受的,对类别的抽象程度无要求,即抽象度较高和较低的类别可以同时分类。通过使用更好的机器学习算法和其他的HNC语言理解技术,性能可以进一步提高。
- 张运良张全
- 关键词:文本分类句类向量空间模型HNC理论
- 基于句间关系的汉语语义块省略恢复被引量:6
- 2008年
- 语义块是句子的语义构成单位,句子内发生的省略现象可以归结为语义块的省略。该文在句类分析的基础上,从小句间语义块共享关系的角度分析语义块的省略。将语义块的省略分为语义块整块共享形成的省略和语义块部分共享形成的省略,分析了两种情况的特点,并给出了相应的处理算法。测试表明,该算法对于两种省略均有很好的处理效果。
- 贾宁张全
- 关键词:计算机应用中文信息处理省略
- 基于汉语字义基元化的新词处理分析
- 2010年
- 现代汉语中具有"字义基元化,词义组合化"的特点,本文根据这一特点,从汉字动态组合形成新词的角度,对汉语中新词语的释义进行了分析。通过对比词典收录的词语义项和新词语释义,发现字义在网络环境出现的新词中有了拓展。针对这些义项进一步分析发现,字义的核心语义内容没有发生根本的变化,而是表述对象的拓展。本文以组成网络新词比较活跃的"裸"字为例进行了具体说明,研究结果有助于汉语新词处理。
- 张全袁毅
- 关键词:新词语词汇语义语义分析
- 基于概念匹配的中文问答处理模型核心问题探讨被引量:2
- 2006年
- 为了解决问答处理系统中的语义模糊问题,提高问答处理的性能,研究人员尝试采用概念作为系统处理的对象,而不再是语言表层符号,然而,在引入概念进行处理的同时引来了一些新的问题,如概念的抽取、概念关联计算以及特定于问答系统的问题理解、问题求解、答案生成等问题。在概念抽取、概念关联计算方面,已有一些比较成功的算法。本文将在此基础上,针对实现这样一个问答处理系统所存在的一些未涉及的核心问题进行一个探讨,同时提出解决以上问题的方法。实验及实际应用表明基于所提出算法的概念问答系统具有较强的性能,系统总体自动处理准确率将近达到40%。在实际应用中也表现出较高的应用价值。
- 吴晨张全
- 关键词:计算机应用中文信息处理中文问答系统语言概念空间
- 自然语言处理中句群划分及其判定规则研究被引量:9
- 2007年
- 在自然语言处理,尤其是在基于语法和语义规则的信息检索、机器翻译系统中,对于句群的处理显得格外重要。它是计算机从理解孤立的词义和句义上升到理解篇章整体中心内容的一个重要的跃变步骤。作为句群理解的关键一步,句群的识别显得尤为重要。该文从句群本身的构成特点出发,对句群进行了内部语义组合方式的划分,这一划分适宜计算机进行处理。根据已经取得的“HNC语言概念空间表示”的研究成果,制定了识别具有以上构成特点句群的相关规则。实验表明,划分方法具有很高的句群覆盖率,同时切分规则具有很高的准确度。
- 吴晨张全
- 关键词:句群计算语言学