董宇
- 作品数:21 被引量:13H指数:2
- 供职机构:金陵科技学院更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划国家社会科学基金更多>>
- 相关领域:语言文字自动化与计算机技术兵器科学与技术政治法律更多>>
- 一种电动拉杆箱
- 本实用新型公开了一种电动拉杆箱,包括箱体和太阳能电池板,太阳能电池板设于箱体上方表面,箱体顶端设有伸缩式拉杆,箱体底端四个边角处均设有万向轮,箱体内靠近万向轮一侧均设有与万向轮对应的小型电机,小型电机和万向轮均通过电连接...
- 陈望董宇肖娴郭靖刘乃文冯嘉熙俞静乔德林
- 文献传递
- 对新疆学生汉语作文中偏误的统计分析及对比思考被引量:3
- 2006年
- 董宇
- 关键词:少数民族学生统计分析偏误汉语作文第二语言习得者第二语言学习
- 基于语境计算模型的词义消歧
- 本文提出相对词频的概念,据此建立起语境计算模型,利用歧义字段前后语境词语相对词频信息对多义词进行消歧。以“黄色”和“黄金”为例进行实验,封闭测试精确率分别达到99.41%和98.93%,开放测试精确率分别达到96.37%...
- 曲维光董宇陈钟陈小荷
- 关键词:计算语言学词义消歧
- 文献传递
- 带标注语料库中切分变异的统计分析及思考
- 本文对1998年1月<人民日报>标注语料中具有多种切分形式的词进行了统计,发现1034个单纯的切分变异.在此基础上从不同层面分析切分变异的出现规律,得出大量的切分变异出现在低频词、二字词中,且随着使用频率的增加,变异的从...
- 董宇陈小荷
- 关键词:金本位统计分析语料库
- 文献传递
- 带标注语料库中切分变异的统计分析及思考
- 本文对1998年1月《人民日报》标注语料中具有多种切分形式的词进行了统计,发现1034个单纯的切分变异。在此基础上从不同层面分析切分变异的出现规律,得出大量的切分变异出现在低频词、二字词中,且随着使用频率的增加,变异的从...
- 董宇陈小荷
- 关键词:金本位
- 文献传递
- 称谓语与人名自动识别
- 计算机的人名自动识别一直是个比较复杂的问题。见诸报道的多数是统计方法识别中文姓名。本文通过分析称谓语与人名的分布关系,拟在建立一个规则的姓名辨识系统,使计算机可以自动识别中外人名。
- 董宇
- 关键词:称谓语人名识别
- 文献传递
- 面向大型叙事作品的指人成分识别
- 本文定义了指人成分的概念,分析了指人成分的构成和分布特征,并面向大型叙事作品,提出了一种基于邻字熵统计和规则发现相结合的指人成分识别方法.实验对小说<英雄出世>的生文本进行了多次抽样测试,取得了86.93%的正确率和91...
- 钱小飞陈小荷董宇何晓丽
- 关键词:叙事作品
- 文献传递
- 面向大型叙事作品的指人成分识别被引量:1
- 2008年
- 本文定义了指人成分的概念,分析了指人成分的构成和分布特征,并面向大型叙事作品,提出了一种基于邻字熵统计和规则发现相结合的指人成分识别方法。实验对小说《英雄出世》的生文本进行了多次抽样测试,取得了86.93%的正确率和91.83%的召回率。
- 钱小飞陈小荷董宇何晓丽
- 基于语境计算模型的词义消歧
- 本文提出相对词频的概念,据此建立起语境计算模型,利用歧义字段前后语境词语相对词频信息对多义词进行消歧.以'黄色'和'黄金'为例进行实验,封闭测试精确率分别达到99.41%和98.93%,开放测试精确率分别达到96.37%...
- 曲维光董宇陈钟陈小荷
- 关键词:计算语言学词义消歧
- 文献传递
- 基于词库与词法的分词不一致研究
- 2008年
- 分词不一致问题一直严重影响带标注语料库的标注质量,利用词库与词法知识,可以合理地阐释分词不一致产生的根源,并结合建立的规则库、组合型歧义库、固定词表和特殊单字词表,可以解决汉语分词语料库中相同结构类型的分词不一致问题。计算机利用这些知识较好地识别出了"大+动词(单字)""动补结构"和"颜色词+物体名",召回率在96%以上,精确率在95%以上,并能根据用户的要求统一处理成"分"或"合"的形式。
- 董宇陈小荷
- 关键词:词库词法自动分词