搜索到8127篇“ 语音合成“的相关文章
情感语音合成综述
2024年
作为语音领域一个重要的研究方向,语音合成致力于将文本转化为语音。随着深度学习技术的快速发展,语音合成的目的早已不仅仅是合成一段“能听懂”的音频这么简单,情感的加入往往能使语音变得更加具有表现力。基于此,情感语音合成语音中加入不同的情感并对情感进行调控,以生成灵活且准确的情感语音。从情感语音合成中的几个关键科学问题出发,分别对近几年来基于情感迁移、情感强度控制和情绪混合的发展进行了总结分析,并介绍了情感语音合成的相关数据集和评价指标,最后对情感语音合成进行了展望。
施昊翔张旭龙王健宗程宁肖京
关键词:情感语音合成情感迁移
一种语音合成方法
本发明公开了一种语音合成方法,本发明将谱梯度Sobel算子创新性地引入到语音合成模型的损失函数设计中,从而提高了语音合成中特征预测模型细节刻画的能力;本发明提升语音合成的音质。
袁熹
语音合成方法及装置
本申请涉及一种语音合成方法及装置,其中,该方法包括:响应于语音合成请求,从语音合成请求中解析出文本数据及音频数据,并从文本数据中提取出文本特征,从音频数据中提取出目标对象的音频特征;利用多头注意力机制捕捉文本特征和音频特...
蒋正浩
语音合成方法及装置
本发明提供一种通过在智能设备(包括:各种电脑和移动设备)上实现即时发音的语音合成方法,可以让失语者(无法正常讲话的人)通过敲击键盘与普通人进行语音交流。该编码方案比较简单,就算不使用快捷键的情况下,使用者只需要在键盘上先...
张进
语音合成方法及装置
本申请适用于终端人工智能技术领域,提供了一种语音合成方法及装置,所述方法包括:获取身份编码,所述身份编码用于指示进行语音转换的第三方的身份;确定待转换文本对应的各个音素的音素时长,其中,至少一个所述音素的音素时长是根据所...
别凡虎
语音合成方法及装置
本申请提供了一种语音合成方法及装置,其中,该方法包括:获取训练数据,从所述训练数据中提取音频特征,其中,所述音频特征包括基频、能量、音速时长、和梅尔频谱;利用聚类算法对所述音频特征进行聚类,以将所述训练数据分成不同的簇,...
蒋正浩王建成
语音合成方法和装置
本公开涉及一种利用人工智能技术的语音合成方法、语音合成装置和设备以及计算机可读存储介质。语音合成方法包括:接收输入文本;基于输入文本分别生成表征语音基频信息的预测基频特征和表征语音频谱包络信息的预测倒谱特征;基于预测基频...
顾宇
语音合成方法及装置
本发明提供了一种语音合成方法及装置,该方法包括:利用包括第一文本特征数据和第一语音特征数据的第一训练样本集对初始神经网络训练得到第一模型;多个第一文本特征数据对应的文本领域不同;多个第一语音特征数据对应的发音主体不同;利...
伍淳华郑康锋武斌张冬梅李庆
语音合成编码方法及装置
本说明书一个或多个实施例提供的一种语音合成编码方法及装置,在开始将文本数据合成为pcm流数据后,根据当前系统负载情况动态计算开始播放需要的起始缓冲阈值Tstart,若缓冲区缓冲时长大于所述起始缓冲阈值Tstart时,读取...
皮碧虹杨德文龙丁奋
一种语音合成方法和装置
本发明实施例提供了一种语音合成方法和装置,所述方法包括:获取输入文本和风格生成模块,根据所述输入文本和所述风格生成模块得到风格特征表示;获取音色标记以及目标语音合成模型;其中,所述目标语音合成模型为基于预先训练的用于提取...
詹皓粤林悦

相关作者

陶建华
作品数:425被引量:361H指数:12
供职机构:清华大学
研究主题:语音 语音合成 声学特征 存储介质 情感识别
凌震华
作品数:124被引量:68H指数:5
供职机构:中国科学技术大学
研究主题:语音合成 语音 语音信号 音质 声学特征
蔡莲红
作品数:197被引量:672H指数:16
供职机构:清华大学
研究主题:语音合成 汉语 语音识别 文语转换 TTS
王仁华
作品数:220被引量:502H指数:12
供职机构:安徽科大讯飞信息科技股份有限公司
研究主题:语音识别 语音合成 声学模型 说话人确认 中文信息处理
戴礼荣
作品数:205被引量:566H指数:12
供职机构:中国科学技术大学
研究主题:语音识别 语音合成 说话人确认 神经网络 语种识别