您的位置: 专家智库 > >

余鹏

作品数:2 被引量:3H指数:1
供职机构:微软公司更多>>
发文基金:国家自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 2篇语音
  • 2篇语音检索
  • 2篇汉语
  • 1篇后验概率

机构

  • 2篇清华大学
  • 2篇微软公司

作者

  • 2篇孟莎
  • 2篇刘加
  • 2篇余鹏

传媒

  • 1篇自动化学报
  • 1篇清华大学学报...

年份

  • 1篇2010
  • 1篇2008
2 条 记 录,以下是 1-2
排序方式:
基于后验概率词格的汉语自然对话语音索引被引量:2
2008年
语音索引是语音检索任务的关键问题之一。该文针对汉语自然对话语音索引问题,提出了基于子词的词格索引和融合方法。采用后验概率形式表示的词格取代最优路径进行索引。根据后验概率词格特性,将LVCSR识别得到的基于词的词格分解为基于子词的词格;在汉语自然对话语音关键词检测任务上,采用字、有调音节和无调音节作为子词单元,关键词检测指标品质因数相对基线系统分别提高了3.9%、4.4%和7.4%。根据后验概率词格节点之间、边之间可合并的特性,在词格内部进行合并,并对不同识别器结果词格进行融合,品质因数指标由基线系统的68.3%(用LV SCR得到的)和66.9%(用音节识别器得到的)提高到78.8%。
孟莎余鹏Frank Seide刘加
关键词:语音检索
基于格的汉语自然对话语音索引方法研究被引量:1
2010年
对汉语自然对话语音索引问题进行了研究.比较了不同单元格的识别和检索性能,提出不同单元格的转换方法、格间的融合方法以及格内节点与边的合并方法.格转换实现了识别单元和索引单元的分离,词格转换得到的无调音节格将品质因数(Figure of merit,FOM)从基线系统的69.2%提高到73.7%;格间融合综合利用多个格的信息,将FOM进一步提高到78.6%;格内合并对格进行了有效的压缩,使其可应用于海量语音检索.
孟莎余鹏刘加
关键词:语音检索
共1页<1>
聚类工具0