公共文化服务平台

国家自然科学基金(61063026): 作品数：10 被引量：67H指数：5; 相关作者：吐尔根·依布拉音姜文斌麦热哈巴艾力麦热哈巴·艾力艾山吾买尔更多>>; 相关机构：新疆大学中国科学院中国科学院研究生院更多>>; 发文基金：国家自然科学基金国家社会科学基金国家电子信息产业发展基金更多>>; 相关领域：自动化与计算机技术更多>>

维吾尔语词法中音变现象的自动还原模型被引量：8: 2012年; 该文针对维吾尔语的音变现象,提出了一种自动还原模型。与以往方法不同的是,此模型中我们把音变现象泛化,先假设维吾尔语中所有语音都有音变现象,从而将还原问题转化为类似于词性标注问题,再利用标注的方法解决了还原操作。在新疆多语种信息技术重点实验室手工标注的《维吾尔语百万词词法分析语料库》上做了实验,还原模块作为维吾尔语词法分析器的一部分,把词法分析器功能的F值从84.1%提高到了91.4%,同时维吾尔语中词缀数目最多、变形情况最复杂的动词词干的还原正确率也达到了88.6%,实际应用中完全可以被接受。; 麦热哈巴艾力姜文斌姜文斌; 关键词：维吾尔语词法分析

维吾尔文-汉文计算机辅助翻译系统中双向翻译记忆子系统的设计与实现被引量：1: 2012年; 计算机辅助翻译(Computer Aided Translation,简称CAT)是一种人机交互式系统.翻译记忆技术是计算机辅助翻译系统中的核心技术.翻译记忆子系统中记忆库的构建,管理以及记忆库中语句相似度的计算非常关键.针对维吾尔文-汉文双向翻译记忆子系统的要求,本文设计出了翻译记忆子系统模型,并在记忆库设计中采用维吾尔文和汉文句子以句子精确对齐的方式存储,同时可以对记忆库进行查找、删除等.对于句子相似度则用自然语言处理中常用的"编辑距离"(edit distance)来计算,将大于阈值的句子所对应的译文句子提供给用户进行翻译参考.结果证明,该双向翻译记忆子系统在维吾尔文-汉文翻译中起到了很好的效果.; 塔依尔江.苏拉依曼尼加提.纳吉米帕肉克.司地克吐尔根.依布拉音艾山吾买尔; 关键词：计算机辅助翻译翻译记忆最短路径

维吾尔文网页聚类算法的设计与实现: 2010年; 将传统的数据挖掘领域中的聚类技术引入网络信息搜索中(Web聚类技术),以解决搜索引擎结果集不便于用户浏览问题为目的。分析维吾尔语的词法特点,选择适合维吾尔文文本聚类的特征,构造可扩展后缀树,选择基类,合并基类,把维吾尔文网页按相似度分成不同的类并形成类标签。; 买买提依明.哈斯木维尼拉.木沙江; 关键词：聚类后缀树 STC

维吾尔语词尾对汉维统计机器翻译影响的研究被引量：8: 2014年; 维吾尔语属于阿尔泰语系,是典型的黏着语,构形词尾在维吾尔语中占很重要的地位,这与汉语差别很大。针对维吾尔语的形态特点,分析汉维统计机器翻译中维吾尔语构形词尾的作用,利用Cherio搭建一个基于层次短语的汉维统计机器翻译系统。使用词级粒度、词干级粒度、词干词尾级粒度的汉维平行语料进行对比实验,探讨不同粒度对汉维统计机器翻译系统的影响。实验结果表明,该汉维统计机器翻译系统可以提高汉维统计翻译的质量,BLEU值达到0.1972。; 米莉万.雪合来提麦热哈巴艾力吐尔根.依布拉音姜文斌; 关键词：词尾统计机器翻译语言模型

基于词典和统计相结合的维吾尔语拼写检查方法被引量：2: 2014年; 该文通过研究国内外相关的拼写错误查错和纠错方法的理论,再结合维吾尔语自身的特点,提出了基于词典和统计相结合的维吾尔语拼写查错方法。首先,提出基于词典的方法进行词库和词干提取的拼写检查;其次,提出基于N元语法的词缀连接有效性判断模型,对未登录词提出基于N元语法的拼写检查模型;最后,结合以上几种方法各自的优点提出基于混合策略的拼写检查方法,该方法在准确性和检查结果可靠性等方面得到了较显著的提高。; 麦合甫热提艾山吾买尔麦热哈巴艾力吐尔根.伊布拉音张健; 关键词：维吾尔语拼写检查词典 N元语法

新疆少数民族语言文字信息处理研究与应用被引量：27: 2011年; 该文主要对国内开展维吾尔、哈萨克、柯尔克孜等少数民族语言信息处理以来的相关研究工作进行了介绍和评价。在此基础上对维吾尔、哈萨克、柯尔克孜文信息处理的进一步发展进行了展望。目的是为了探讨如何加速推进维吾尔、哈萨克、柯尔克孜文信息处理技术的发展。通过对维、哈、柯文操作系统、信息技术标准、语言信息处理及综合应用等四个方面历史和现状的介绍及简单评价,对维、哈、柯语信息处理的发展方向做了相关描述。; 吐尔根·依布拉音袁保社; 关键词：维吾尔文哈萨克文信息处理操作系统自然语言

维吾尔语词法分析的有向图模型被引量：22: 2012年; 维吾尔语是典型的黏着性语言,其派生能力很强,具有丰富的形态变化,同时遵循语音和谐规律,生成过程中会出现弱化、增音、脱落等音变现象.这些特性决定了维吾尔语词法分析的难点,包括词干提取、发生音变字母的还原以及标注.将维吾尔语词的层次结构引入到词法分析研究中,提出了维吾尔语词法分析的有向图模型,该模型将维吾尔语词法分析描述为有向图结构,图中节点表示词干、词缀及其相应标注,其边表示节点之间的转移或生成概率并将此概率作为候选择优的依据.针对维吾尔语在形态变化过程中发生的音变现象,又提出基于词内字母对齐算法的自动还原模型,该模型将音变现象泛化到每个字母上的假设之下,将还原问题转变成类似于词性标注问题,再利用统计方法进行还原.在对新疆多语种信息技术重点实验室手工标注的《维吾尔语百万词词法分析语料库》上进行的实验中,取得了词干提取正确率为94.7%,词干与各词缀切分并标注的F值达到92.6%的好成绩.; 麦热哈巴·艾力姜文斌王志洋吐尔根·依布拉音刘群; 关键词：维吾尔语词法分析词语切分词性标注有向图

基于后缀树的维吾尔文网页聚类算法的研究与实现: 2010年; 该论文分析维吾尔语的词法特点，选择适合维吾尔文文本聚类的特征，构造可扩展后缀树，选择基类，合并基类，把维吾尔文网页按相似度分成不同的类，并形成类标签。通过实验表明该算法的效率比其他传统的聚类算法比具有较高的性能．大大提高查找信息的命中率。; 买买提依明·哈斯木维尼拉·木沙江; 关键词：聚类后缀树 STC

维吾尔文智能输入法研究被引量：4: 2013年; 开发智能化的输入法是维吾尔文输入技术的一个发展方向,也是维吾尔文自然语言信息处理的基础性研究课题。该文根据维吾尔文自身特点,对用户输入过程中所犯各种错误进行分析,设计并实现了词语搭配知识库,提出了基于二元语法模型的一种新型维吾尔文输入算法,并给出了实现其关键模块功能的程序流程图。它具有自动预测、自动联想输入和自动校对等功能。; 米日姑·肉孜吐尔根·依布拉音麦热哈巴·艾力; 关键词：中文信息处理维吾尔文智能输入法语言模型

壮、蒙古、维、哈、柯、朝语信息处理研究进展被引量：7: 2018年; 少数民族语言文字处理是中国语言文字信息处理的重要组成部分。自20世纪80年代以来,少数民族语言文字处理在各民族科研、产业工作者的共同努力下,在操作系统、输入输出、编辑排版、标准化、语言资源建设、机器翻译、软件平台、人才培养等各个方面取得了长足的进展。本文综述壮、蒙古、维吾尔、哈萨克、柯尔克孜、朝鲜6个少数民族的语言文字信息处理历史、现状及存在问题,并对其未来发展方向进行展望。; 刘连芳海银花那顺乌日图黄家裕吐尔根·依布拉音玄龙云; 关键词：蒙古文朝鲜文信息处理

国家自然科学基金(61063026)

文献类型

领域

主题

机构

作者

传媒

年份

用户反馈

国家自然科学基金(61063026)

文献类型

领域

主题

机构

作者

传媒

年份

用户登录

用户反馈