公共文化服务平台

2024年7月6日星期六

|

欢迎来到青海省图书馆•公共文化服务平台

登录 | 注册 | 进入后台

[APP下载]

[APP下载]

扫一扫,既下载

全民阅读
职业技能
专家智库
参考咨询

您的位置： 专家智库 > >

国家自然科学基金(60773173): 作品数：14 被引量：75H指数：6; 相关作者：曲维光陈小荷李斌丁德鑫唐旭日更多>>; 相关机构：南京师范大学北京大学陕西师范大学更多>>; 发文基金：国家自然科学基金国家社会科学基金国家重点基础研究发展计划更多>>; 相关领域：自动化与计算机技术语言文字更多>>

相关作品
相关人物
相关机构
相关资助
相关领域

文献类型

14篇期刊文章
6篇会议论文

领域

16篇自动化与计算...
3篇语言文字
1篇文化科学

主题

7篇中文
4篇信息处理
4篇隐喻
4篇中文信息
4篇中文信息处理
4篇自然语言
3篇知识库
3篇中文自动分词
3篇自动分词
3篇自然语言理解
3篇汉语
3篇分词
2篇语料
2篇语言处理
2篇语义
2篇随机场
2篇条件随机场
2篇歧义
2篇歧义消解
2篇自然语言处理

机构

15篇南京师范大学
5篇北京大学
3篇江苏省信息安...
2篇陕西师范大学
1篇金陵科技学院
1篇教育部
1篇西北民族大学

作者

12篇曲维光
4篇于丽丽
4篇陈小荷
4篇丁德鑫
4篇李斌
3篇俞士汶
3篇唐旭日
2篇朱学锋
2篇李惠
2篇张霄军
2篇李素建
2篇贺胜
2篇许超
1篇徐涛
1篇朱荷香
1篇宋涛
1篇董宇
1篇贾玉祥
1篇卢俊之
1篇石民

传媒

3篇中文信息学报
2篇南京师范大学...
1篇当代语言学
1篇南京大学学报...
1篇微电子学与计...
1篇计算机应用研...
1篇语言文字应用
1篇计算机工程与...
1篇文教资料
1篇术语标准化与...
1篇心智与计算

年份

3篇2010
9篇2009
8篇2008

共 14 条记录，以下是 1-10

全选清除导出

排序方式：

面向自动文摘的文本结构划分被引量：3: 2008年; 文本结构划分是自动文摘研究中的一个关键阶段,也是自然语言处理领域的重要课题.本文通过构建段落向量空间模型,提出一种综合考察相邻段落相似度和连续段落平均相似度的意义段划分方法,使文摘内容更加全面,结构更加平衡.实验结果表明,该方法能够较有效地反映文章的内容结构,对有子标题组织和无子标题组织的文章均适用;由于考虑了总起段,使得文本结构划分更加合理,为自动文摘系统的后续工作打下坚实的基础.; 朱荷香曲维光卢俊之李素建邵艳秋; 关键词：文本结构自动文摘向量空间模型

基于CRF模型的组合型歧义消解研究被引量：9: 2008年; 组合型歧义切分是汉语自动分词的难点之一.为此,利用CRF(条件随机场)模型,以歧义字段的上下文的词和词性建立特征模板,进行歧义消解研究.以1998年半年《人民日报》为语料,对常用的10个组合歧义字段进行消歧,平均消歧正确率达到96.35%,取得了良好的效果.实验表明,利用该模型能有效提高消歧正确率.; 丁德鑫曲维光徐涛董宇; 关键词：中文自动分词 CRF

面向中文自动分词的可扩展式电子词典研究被引量：3: 2008年; 在中文自动分词及词性标注系统中,电子词典是系统的重要组成部分,也是影响系统性能的重要因素之一。介绍了电子词典应该具备的查询功能及常用的组织结构,给出了一种结构为系统词典+用户词典的可扩展式电子词典机制。其系统词典是基于首字Hash散列的逐字二分词典结构,用户词典采用基于首字Hash散列的链接表词典结构,具有很强的扩展性和实用性。; 贺胜曲维光许超; 关键词：词典结构自动分词 HASH

计算语言学浅介被引量：4: 2009年; 计算语言学是文理交叉的新兴学科,以自然语言(汉语、英语等)的计算机处理(包括分析和生成)为研究内容,其最高境界是自然语言的机器理解,从而在人机之间实现自然语言的交互。本文简单介绍计算语言学和自然语言处理的研究对象、内容和当前的主攻方向。语言知识库是支撑自然语言处理研究的重要基础。本文也介绍了作者及其同仁在语言知识库建设方面所作的努力。最后,展望了自然语言理解研究的前景。; 俞士汶朱学锋; 关键词：计算语言学自然语言处理自然语言理解语言知识库

基于仙人掌模型的动词“吃”的隐喻分类体系被引量：1: 2009年; 动词“吃”是一个高频性的常用词，表示动物尤其是人类的基本生理功能。本文以动词“吃”组成的短语为隐喻考察对象，通过隐喻现象的形式化描写，探求语义规律．并基于隐喻性词义生成和演变的仙人掌发展模型，尝试构建动词“吃”的隐喻体系。; 李惠曲维光; 关键词：隐喻

超大规模语料库精加工技术研究被引量：3: 2009年; 在对现有词法标注器标注质量考察分析的基础上,本文提出语料库精加工的方法。利用这些方法,对从《人民日报》社购得的1998年上半年样例语料重新进行校对,从中排查并修改了5万余处切分和词性标注的错误或不一致,提高了样例语料的质量。本文提出的基于上下文词语相对词频比之和RFR_SUM的消歧模型,具有很好的分类效果。利用重新校对过的样例语料作为训练数据,再利用RFR_SUM模型对400余种常见歧义现象的消解进行训练,并将所得到的模型应用于超大规模语料的精加工,也取得良好的效果。; 曲维光唐旭日俞敬松

名词转喻的自动理解: 转喻是汉语文本中常见的语言现象。在主宾语位置上,名词会出现转喻用法。该用法往往是用凸显特征转喻本体,而凸显特征则蕴含在世界知识和人类主观体验之中,计算机自动识别转喻特别是找出转喻的本体难度很大。对此,我们提出了两点策略来...; 李斌曲维光陈小荷; 关键词：转喻词语相似度相关词; 文献传递

基于词频和语义信息的组合型歧义消解: 组合型歧义切分是汉语自动分词的难点之一。本文挖掘歧义字段上下文的相对词频信息和语义信息,建立语境计算模型。首先基于相对词频比,建立RFRUM模型,其次采用类似K近邻的分类思想,利用知网,建立语义相似度计算模型,最后尝试两...; 丁德鑫曲维光于丽丽陈小荷李惠; 关键词：中文自动分词语境信息语义计算; 文献传递

基于词典的名词性隐喻识别: 隐喻是用一个事物来类比另外一个事物的语言表达,在自然语言中非常普遍,要实现自然语言理解隐喻处理不可避免。本文针对最基本的隐喻类型——名词性隐喻,提出基于词典的识别方法。结合同义词词林的语义距离与HowNet的语义关系来识...; 贾玉祥俞士汶; 关键词：名词性隐喻词典语义距离语义关系; 文献传递

“像”的明喻计算被引量：8: 2008年; 汉语隐喻计算是一项难度很大的工作,明喻由于带有明显的标志(比喻词)成为计算机自动识别的基础类型。该文着力于典型的比喻词"像"的比喻义及相关比喻成分的自动识别。首先,人工标注了1 586句语料,分析了明喻句的基本特点。然后,使用最大熵模型对"像"的比喻义和非比喻义进行分类,开放测试F值达到了89%。最后,用条件随机场模型识别出比喻的本体、喻体和相似点,F值分别达到了73%、86%和83%。; 李斌于丽丽石民曲维光; 关键词：计算机应用中文信息处理

全选清除导出

共2页<1 2>

执行隐藏清空

用户登录

用户反馈

标题：

*标题长度不超过50

邮箱：

*

反馈意见：

反馈意见字数长度不超过255

验证码：

看不清楚？点击换一张