国家自然科学基金(61063036)
- 作品数:7 被引量:22H指数:5
- 相关作者:艾孜尔古丽齐向卫祖丽皮亚张海军更多>>
- 相关机构:新疆师范大学中国海洋大学更多>>
- 发文基金:教育部人文社会科学研究基金国家自然科学基金国家科技支撑计划更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- 基于网站用词调查的现代维吾尔语词长研究被引量:9
- 2012年
- 首先陈述调查使用的语料媒体来源、应用领域、采集的语料时间跨度与统计方法;其次按词长排序的前20个最长的词情况,介绍词语长度分布;在此基础上分析词干长度分布、常用纯词干长度分布及常用去尾词干长度分布;最后介绍平均词干、词长统计与分析结果。
- 玉素甫.艾白都拉艾孜尔古丽祖丽皮亚
- 关键词:网络媒体
- 基于网站用词调查的现代维吾尔语词干提取和应用研究被引量:11
- 2012年
- 通过对维吾尔文网站的词干应用状况调查,进而对现代维吾尔文词干的提取和应用进行研究。陈述调查使用的语料媒体来源、应用领域、采集的语料时间跨度与统计方法;介绍词干概念;讨论现代维吾尔语词干提取系统;研究词干在网络媒体语料中应用形式;介绍和讨论词干分布结果,最后总结以上内容。
- 艾孜尔古丽齐向卫玉素甫.艾白都拉
- 关键词:现代维吾尔语网站词干
- 用于构建维吾尔文语料库的中文件格式转换技术研究被引量:2
- 2012年
- 研究在维吾尔文字语料库建立过程中,从MS-DOS系统上排版的书刊、杂志中获得维吾尔语单词,并转换到Windows环境上RTF格式的一种快速解决方法,然后提出维吾尔文字Unicode代码对应的RTF代码表和动态生成维吾尔文RTF文件的简单方法。实践证明这种方法有助于提高语料库构造中的大量单词收集的效率和质量。
- 艾斯卡尔.亚克甫艾孜尔古丽玉素甫.艾白都拉
- 关键词:TEXT维吾尔文
- 信息处理用现代维吾尔语词干词类标记集研究被引量:8
- 2011年
- 阐述了研究与制定"现代维吾尔语词干词类标注标记集"必要性,讨论只靠语法角度提出的一类词干"现代维吾尔语词干词类标注标记集"有限性;论述了通过吸收国内外英语、汉语层次分析研究的最新成果,结合现代维吾尔语词干的本身特点研究现代维吾尔语词干语法语义分类体系迫切性;讨论信息处理用现代维吾尔语一类、二类、三类和四类词干词类标记规范。
- 玉素甫.艾白都拉张海军艾孜尔古丽
- 关键词:维吾尔语信息处理词干
- 基于网站用词调查的现代维吾尔语词尾切分和应用研究被引量:6
- 2012年
- 首先对现代维吾尔语词尾或词缀进行描述和定义;其次陈述调查使用的网络媒体语料来源、语料说明、词法结构、词语还原方法、语料应用领域、采集的语料时间跨度与统计方法;最后介绍词尾的使用情况,包括频次超过万次以上的词尾、词尾频次分段分析、词尾长分段分析结果。
- 玉素甫.艾白都拉艾孜尔古丽
- 关键词:网站词尾切分
- 用于构建维吾尔文语料库的中文件格式转换技术研究
- 2012年
- 文章研究的是在维吾尔文字语料库建立过程中,从MS-DOS系统上排版的书刊,杂志中获得维吾尔语单词,并转换到WINDOWS环境上RTF格式的一种快速解决方法,然后提出维吾尔文字Unicode代码对应的RTF代码表和动态生成维吾尔文RTF文件的简单方法。实践证明这种方法有助于提高语料库构造中的大单词收集的效率和质量。
- 艾斯卡尔.亚克甫艾孜尔古丽玉素甫.艾白都拉
- 关键词:TEXT维吾尔文
- 现代维吾尔文网络媒体用词研究被引量:7
- 2012年
- 随着社会的发展,语言也在不断地发展变化。为了切实掌握维吾尔语当前使用情况,及时把握维吾尔语年度用词的第一手资料,对网络媒体的现代维吾尔语用词进行研究。首先对现代维吾尔语词语的结构进行分析,并给出描述现代维吾尔语词法的结构模型;然后介绍调查使用的语料媒体来源、应用领域、采集的语料时间跨度与统计方法以及统计结果讨论。
- 艾孜尔古丽艾山江.阿不力孜玉素甫.艾白都拉
- 关键词:网站词语