中央高校基本科研业务费专项资金(zyz2011101)
- 作品数:3 被引量:8H指数:1
- 相关作者:江涛于洪志曹晖董晓芳李亚超更多>>
- 相关机构:西北民族大学更多>>
- 发文基金:中央高校基本科研业务费专项资金国家自然科学基金国家科技支撑计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于KNN的中文文本分类性能研究被引量:1
- 2011年
- 本文针对文本分类的文本表示、分类器等关键技术进行了研究,并且使用基于K最近邻(k-NearestNeighbor,KNN)分类算法在系统上实现了文本分类器。在此基础上通过实验数据针对样本集、K的取值等因素对分类效果的影响做了详细的研究比较,通过对性能变化原因分析,提出了最优性能解决方案。
- 王勇徐涛于洪志江涛
- 关键词:文本分类KNN特征降维
- 基于短语的藏汉统计机器翻译系统被引量:6
- 2012年
- 本文针对藏文词法及句法的特点,借助开源统计机器翻译平台,搭建起基于短语的藏汉统计机器翻译系统,重点描述了系统中的藏文编码转换和藏文自动分词的实现方法。最后采用500句新闻领域藏文语料对翻译系统进行测试,取得了Bleu值为0.3425的较好结果。
- 董晓芳曹晖江涛
- 关键词:统计机器翻译自动分词
- 基于词典的藏汉跨语言检索系统研究被引量:1
- 2011年
- 针对跨语言检索中查询翻译歧义问题,文章从藏汉跨语言检索的特点出发,采用了平衡翻译(BalancedTranslation)方法,减少了歧义翻译数量,提高了翻译的准确度.在文档索引上,为了弥补藏文分词对于命名实体识别的不足,采用了4元组的索引方法,明显提高了检索的速度和准确度.
- 李亚超江涛于洪志加羊吉
- 关键词:跨语言检索藏文分词查询翻译