2025年3月29日
星期六
|
欢迎来到青海省图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
搜索到
8127
篇“
语音合成
“的相关文章
资源类型:
全部数字资源类型
期刊文章
政策法规
学位论文
专利
会议论文
标准
专著
科技成果
产品样本
科技报告
全部数字资源类型
全部数字资源类型
期刊文章
政策法规
学位论文
专利
会议论文
标准
专著
科技成果
产品样本
科技报告
排序方式:
相关度排序
被引量排序
时效性降序
时效性升序
相关度排序
相关度排序
被引量排序
时效性降序
时效性升序
情感
语音合成
综述
2024年
作为
语音
领域一个重要的研究方向,
语音合成
致力于将文本转化为
语音
。随着深度学习技术的快速发展,
语音合成
的目的早已不仅仅是
合成
一段“能听懂”的音频这么简单,情感的加入往往能使
语音
变得更加具有表现力。基于此,情感
语音合成
在
语音
中加入不同的情感并对情感进行调控,以生成灵活且准确的情感
语音
。从情感
语音合成
中的几个关键科学问题出发,分别对近几年来基于情感迁移、情感强度控制和情绪混合的发展进行了总结分析,并介绍了情感
语音合成
的相关数据集和评价指标,最后对情感
语音合成
进行了展望。
施昊翔
张旭龙
王健宗
程宁
肖京
关键词:
情感语音合成
情感迁移
一种
语音合成
方法
本发明公开了一种
语音合成
方法,本发明将谱梯度Sobel算子创新性地引入到
语音合成
模型的损失函数设计中,从而提高了
语音合成
中特征预测模型细节刻画的能力;本发明提升
语音合成
的音质。
袁熹
语音合成
方法及装置
本申请涉及一种
语音合成
方法及装置,其中,该方法包括:响应于
语音合成
请求,从
语音合成
请求中解析出文本数据及音频数据,并从文本数据中提取出文本特征,从音频数据中提取出目标对象的音频特征;利用多头注意力机制捕捉文本特征和音频特...
蒋正浩
语音合成
方法及装置
本发明提供一种通过在智能设备(包括:各种电脑和移动设备)上实现即时发音的
语音合成
方法,可以让失语者(无法正常讲话的人)通过敲击键盘与普通人进行
语音
交流。该编码方案比较简单,就算不使用快捷键的情况下,使用者只需要在键盘上先...
张进
语音合成
方法及装置
本申请适用于终端人工智能技术领域,提供了一种
语音合成
方法及装置,所述方法包括:获取身份编码,所述身份编码用于指示进行
语音
转换的第三方的身份;确定待转换文本对应的各个音素的音素时长,其中,至少一个所述音素的音素时长是根据所...
别凡虎
语音合成
方法及装置
本申请提供了一种
语音合成
方法及装置,其中,该方法包括:获取训练数据,从所述训练数据中提取音频特征,其中,所述音频特征包括基频、能量、音速时长、和梅尔频谱;利用聚类算法对所述音频特征进行聚类,以将所述训练数据分成不同的簇,...
蒋正浩
王建成
语音合成
方法和装置
本公开涉及一种利用人工智能技术的
语音合成
方法、
语音合成
装置和设备以及计算机可读存储介质。
语音合成
方法包括:接收输入文本;基于输入文本分别生成表征
语音
基频信息的预测基频特征和表征
语音
频谱包络信息的预测倒谱特征;基于预测基频...
顾宇
语音合成
方法及装置
本发明提供了一种
语音合成
方法及装置,该方法包括:利用包括第一文本特征数据和第一
语音
特征数据的第一训练样本集对初始神经网络训练得到第一模型;多个第一文本特征数据对应的文本领域不同;多个第一
语音
特征数据对应的发音主体不同;利...
伍淳华
郑康锋
武斌
张冬梅
李庆
语音合成
编码方法及装置
本说明书一个或多个实施例提供的一种
语音合成
编码方法及装置,在开始将文本数据
合成
为pcm流数据后,根据当前系统负载情况动态计算开始播放需要的起始缓冲阈值Tstart,若缓冲区缓冲时长大于所述起始缓冲阈值Tstart时,读取...
皮碧虹
杨德文
龙丁奋
一种
语音合成
方法和装置
本发明实施例提供了一种
语音合成
方法和装置,所述方法包括:获取输入文本和风格生成模块,根据所述输入文本和所述风格生成模块得到风格特征表示;获取音色标记以及目标
语音合成
模型;其中,所述目标
语音合成
模型为基于预先训练的用于提取...
詹皓粤
林悦
加载更多 ∨
相关作者
陶建华
作品数:425
被引量:361
H指数:12
供职机构:清华大学
研究主题:语音 语音合成 声学特征 存储介质 情感识别
凌震华
作品数:124
被引量:68
H指数:5
供职机构:中国科学技术大学
研究主题:语音合成 语音 语音信号 音质 声学特征
蔡莲红
作品数:197
被引量:672
H指数:16
供职机构:清华大学
研究主题:语音合成 汉语 语音识别 文语转换 TTS
王仁华
作品数:220
被引量:502
H指数:12
供职机构:安徽科大讯飞信息科技股份有限公司
研究主题:语音识别 语音合成 声学模型 说话人确认 中文信息处理
戴礼荣
作品数:205
被引量:566
H指数:12
供职机构:中国科学技术大学
研究主题:语音识别 语音合成 说话人确认 神经网络 语种识别
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张