张鹏远
作品数: 167被引量:145H指数:7
  • 所属机构:中国科学院声学研究所
  • 所在地区:北京市
  • 研究方向:电子电信
  • 发文基金:国家自然科学基金

相关作者

颜永红
作品数:412被引量:657H指数:14
供职机构:中国科学院声学研究所
研究主题:语音 语音识别 声学模型 音素 神经网络
潘接林
作品数:74被引量:170H指数:6
供职机构:中国科学院声学研究所
研究主题:语音识别 语音识别系统 声学模型 语音 特征矢量
赵庆卫
作品数:50被引量:93H指数:7
供职机构:中国科学院声学研究所
研究主题:语音识别 发音 语音 连续语音识别 关键词
韩疆
作品数:22被引量:16H指数:3
供职机构:中国科学院声学研究所
研究主题:语音识别 令牌 关键词 语音 关键词检测
周军
作品数:11被引量:5H指数:1
供职机构:中国科学院声学研究所
研究主题:自然语言处理技术 语音识别 存储介质 编码图像 编码器
面向开放域问答的段落选择方法、装置、设备及存储介质
本申请提供了一种面向开放域问答的段落选择方法、装置、设备及存储介质,涉及自然语言处理技术领域。该方法包括:通过将海量文本进行筛选,确定目标文档。基于目标文档中的第一实体和问题文本中的第二实体构建实体树,从而可以基于实体树...
周军付瑞柳张鹏远颜永红
一种端到端双语混合语音识别训练方法及系统
本发明提供了一种端到端双语混合语音识别训练方法及系统,所述训练方法包括:使用未经训练的神经网络模型,利用多语言语音数据经过自监督训练,得到第一预训练模型;使用第一预训练模型,利用多语言语音有标注数据经过有监督训练,得到第...
程高峰张鹏远颜永红杨恺心叶凌轩赵庆卫
一种多个说话人的语音转折点检测方法及装置
本申请实施例公开了一种多个说话人的语音转折点检测方法及装置,方法包括:接收多个说话人的混合语音;切分混合语音,得到M个语音片段,M为正整数;提取每个语音片段的特征;将每两个相邻的语音片段的特征进行拼接,得到与每两个相邻的...
张鹏远张学帅颜永红
文献传递
连接时序分类准则声学建模方法优化被引量:2
2018年
对基于连接时序分类准则(connectionist temporal classification,CTC)的端到端声学建模方法进行研究和优化。研究分析了不同声学特征、建模单元以及神经网络结构对CTC声学模型性能的影响,针对CTC模型中blank符号共享导致的建模缺陷提出了建模单元相关的非共享blank方法进行改进,并引入融合建模单元关联信息的模型初始化方法进一步提高CTC模型的性能。在300小时标准英文数据集Switchboard的实验结果显示,结合非共享blank、时延神经网络以及融合建模单元关联信息的初始化方法,CTC声学模型相对于基线系统在词错误率上取得绝对1.1%的下降,同时在训练速度上取得3.3倍的提高,实验结果证明本文针对端到端声学建模提出的优化方法是有效的。
王智超张鹏远潘接林颜永红
关键词:建模方法声学特征初始化方法
一种基于增强技术的对话状态追踪方法及系统
本申请提供一种基于增强技术的对话状态追踪方法,包括:获取数据库和已知领域对话状态追踪模型;利用数据增强技术从数据库和已知领域训练样本获取新领域本轮对话文本、上轮对话状态、本轮对话状态标签;使用槽位值类别预测器预测新槽位的...
张学君张鹏远颜永红
一种基于长短时记忆网络的语言模型重估方法
本发明提出了一种基于长短时记忆网络的语言模型重估方法及系统,所述方法包含:步骤100)输入待识别的语言信息,并对输入的待识别的语言信息进行预处理;步骤101)用N元文法语言模型对预处理后的信息进行一遍解码,然后从中选取M...
张鹏远左玲云潘接林颜永红
文献传递
用于音频事件检测的神经网络系统和方法
本发明实施例公开了一种用于音频事件检测的神经网络系统和方法,所述系统包括,特征提取层、卷积层、循环神经网络、前馈网络以及自注意力模块,通过对提取音频获得的对数梅尔谱特征进行处理获得卷积核空间三个维度的特征图;并通过对三个...
张学帅肖胜昌颜永红张鹏远
一种基于空洞卷积神经网络的端到端语种识别分类方法
本发明公开了一种基于空洞卷积神经网络的端到端语种识别分类方法,包括:待训练语种识别网络接收,并对训练语音中提取的帧级别声学底层特征进行至少一层空洞卷积后,输出训练语音后验概率;将训练语音后验概率与真实类别标签的最小均方误...
张鹏远苗晓晓王文超颜永红
文献传递
一种融合信噪比与可懂度双重目标的语音增强方法及系统
本发明属于语音增强信号处理技术领域,具体涉及一种融合信噪比与可懂度双重目标的语音增强方法,包括:将原始语音信号转换为原始时频域特征;将原始时频域特征输入预建立的第一神经网络模型中,获取具有信噪比的第一有效特征;将原始时频...
张鹏远战鸽颜永红
文献传递
一种在线端对端语音转写方法及系统
本发明提供一种在线端对端语音转写方法及系统,在一个实施例中,对所述音频文件提取声学特征;对所述声学特征进行非线性变换和降采样并输出第一特征序列;将第一特征序列进行分块,依次将每块特征序列输入到编码器中并输出多组第二特征序...
张鹏远缪浩然程高峰颜永红