您的位置: 专家智库 > >

艾克白尔·帕塔尔

作品数:1 被引量:3H指数:1
供职机构:新疆大学信息科学与工程学院更多>>
发文基金:新疆维吾尔自治区高技术研究发展计划项目教育部“新世纪优秀人才支持计划”国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇切分
  • 1篇维吾尔
  • 1篇维吾尔文
  • 1篇邻接
  • 1篇互信息

机构

  • 1篇新疆大学

作者

  • 1篇艾斯卡尔·艾...
  • 1篇吐尔地·托合...
  • 1篇艾克白尔·帕...

传媒

  • 1篇模式识别与人...

年份

  • 1篇2013
1 条 记 录,以下是 1-1
排序方式:
维吾尔文无监督自动切分及无监督特征选择被引量:3
2013年
维吾尔文常用切分方法会产生大量的语义抽象甚至多义的词特征,因此学习算法难以发现高维数据中隐藏的结构.提出一种无监督切分方法 dme-TS和一种无监督特征选择方法 UMRMR-UFS.dme-TS从大规模生语料中自动获取单词Bi-gram及上下文语境信息,并将相邻单词间的t-测试差、互信息及双词上下文邻接对熵的线性融合作为一个组合统计量(dme)来评价单词间的结合能力,从而将文本切分成语义具体的独立语言单位的特征集合.UMRMR-UFS用一种综合考虑最大相关度和最小冗余的无监督特征选择标准(UMRMR)来评价每一个特征的重要性,并将最重要的特征依次移入到特征子集中.实验结果表明dme-TS能有效控制原始特征集的规模,提高特征项本身的质量,用UMRMR-UFS的输出来表征文本时,学习算法也表现出其最高的性能.
吐尔地·托合提艾克白尔·帕塔尔艾斯卡尔·艾木都拉
关键词:互信息
共1页<1>
聚类工具0