- 基于频域和时域结合的基音周期提取算法被引量:4
- 2012年
- 基音周期提取是语音编码和语音识别领域的一项重要研究课题。为了解决传统的自相关方法容易出现的半频倍频错误,提出了基于时域和频域分析的提取算法。该算法首先提取时域自相关值最大的若干个候选值;然后统计每个候选值对应的频域上所有相邻两个谐波能量和的最大值,用来对其自相关值进行加权;最后根据历史的基音周期值以及候选基音周期所对应的频域能量值对加权值进行修正。使用Keele数据库进行测试表明,使用该算法后基音周期提取的半频倍频错误率比传统算法下降了50%左右。
- 徐敬德常亮崔慧娟唐昆
- 关键词:语音编码基音周期自相关频域分析
- 基于Gauss混合模型的清浊音恢复改进算法被引量:1
- 2011年
- 为提高子带清浊音(unvoiced/voiced,U/V)解码端恢复算法在不同能量电平下的鲁棒性,提出了一种改进型能量自适应U/V参数解码端恢复算法。通过跟踪长时能量的变化轨迹,在Gauss混合模型(Gaussian mixed model,GMM)下,用归一化的能量参数和线谱频率参数(line spec-tral frequency,LSF)对U/V参数的分布特性进行估计。测试结果表明:在较低的能量电平下,与用绝对能量对U/V参数进行恢复的算法相比,该能量自适应U/V参数恢复算法能够将清浊音误判率降低10%~25%,并将合成语音的平均意见得分(mean opinion score,MOS)提高0.03~0.09,改善了算法的性能。
- 计哲徐敬德常亮崔慧娟唐昆
- 关键词:语音编码特征参数线谱频率
- 电话线质量语音的基音周期提取方法
- 本发明提出一种电话线质量语音的基音周期提取方法,包括以下步骤:对原始语音进行非线性处理,计算原始语音的第一时域自相关函数和非线性处理后的语音的第二时域自相关函数;融合第一时域自相关函数和第一时域自相关函数得到第三时域自相...
- 常亮唐昆崔慧娟
- 文献传递
- 基于SELP的150b/s语音压缩编码算法被引量:2
- 2013年
- 针对极低速率语音压缩编码中比特资源有限,量化精度严重不足的问题,该文提出了一种新的编码策略——减少量化传输的内容,提高重要内容的量化精度。语音经过低通滤波器将最不重要的3~4kHz频谱滤掉,并相应的将采样率从8kHz降低到6kHz,同时保持每帧样点数不变。这样各个参数的联合帧数就减少为原来的3/4,在比特数不变的情况下,可以有效地提高量化精度。另外,对于线性预测系数(1inearpredictioncoefficient,LPC)而言,由于语音谱从原来的0~4kHz变为现在的0~3kHz,LPC的预测阶数可以从10降低为8,参数维数降低,量化精度可以得到进一步提高。在此框架下,结合子带清浊音(band-passvoi-cing,BPVC)解码端恢复算法,实现了高质量极低速率150b/s语音压缩编码算法。与现有的两种150b/s算法相比,客观平均意见得分(meanopinionscore,MOS)分别提高了0.051和0.067,同时LPC参数的谱失真分别降低了0.09和0.16,改进了合成语音质量,提高了可懂度。
- 常亮徐敬德崔慧娟唐昆
- 关键词:低通滤波线性预测系数
- 电话线质量语音的基音周期提取算法被引量:2
- 2013年
- 基音周期提取算法是语音编码中至关重要的组成部分,针对传统自相关方法在电话线质量语音中提取准确度不高的现状,该文提出了一种新的时频结合的基音周期提取算法。时域上,引进一个新的参数——长时基音周期,并根据语音短时平稳特性,对自相关函数进行时域修正,去除不可能成为基音周期的延时值。频域上,计算频域自相关函数,将基音周期候选值所对应的频域自相关值也作为候选值权重的一部分,以增大真正基音周期的权重。通过Keele语音库进行性能测试表明:该算法对电话线质量语音的严重错误率比传统自相关方法的降低46.8%,极大地提高了电话线质量语音的基音周期判决准确度,同时对正常语音的严重错误率也降低了31.2%。
- 常亮徐敬德崔慧娟唐昆
- 关键词:自相关函数
- 基于码字特征的多模式多级矢量量化算法被引量:2
- 2011年
- 为提高声码器中线谱频率参数多级矢量量化的性能,提出了一种根据码字特征进行分模式量化的算法。该算法首先根据下一级量化误差最小化的准则,通过训练得到本级代表模式信息的码字(码字数目为模式数目);然后统计与各个码字相对应的输入矢量占总矢量的比重,继而得到各模式码字所分化的码字个数;最后根据该分化方案训练得到本级所有码字并确定码字与模式的对应关系,从而进行分模式量化。测试结果表明:相比于根据本级码字索引平均进行模式分配的简单方案,该算法可以使平均谱失真(ASD)降低0.05 dB,而平均意见得分(MOS)提高0.02左右。
- 徐敬德常亮计哲崔慧娟唐昆
- 关键词:语音编码线谱频率多级矢量量化多模式
- C^(1)_n 型 Drinfel'd-Sokolov 方程簇的 tau 函数及其 Virasoro 对称
- 常亮
- 关键词:函数
- 用于语音编码的高鲁棒性的信源信道联合编码算法
- 2012年
- 矢量量化因其很高的压缩率被广泛应用在语音压缩编码系统中,抗误码能力差是影响其在高误码信道下性能的主要原因。信道优化矢量量化(channel optimized vector quantization,COVQ)能有效降低有误码情况下的量化误差,但在无误码时的量化性能却不如传统的矢量量化。为了提高矢量量化对信道误码的鲁棒性,同时又不影响无误码时的量化性能,该文提出了一种COVQ与非等重保护(unequal error protection,UEP)相结合的信源信道联合编码方案。该方案利用了COVQ在抗误码方面的优势,同时与UEP有效地结合,不仅能提高COVQ在无误码时的量化性能,而且还能进一步提升抗误码能力。在实际语音编码系统中的仿真测试表明:该方案不仅在无误码时降低了因COVQ导致的量化失真约50%,而且在误码率较高时最后合成语音的平均意见得分(mean opinion score,MOS)比传统的信源信道方案有最大0.58的提高。
- 常亮徐敬德崔慧娟唐昆
- 关键词:矢量量化语音压缩编码