郭建敏
- 作品数:3 被引量:2H指数:1
- 供职机构:陕西师范大学物理学与信息技术学院更多>>
- 发文基金:陕西省自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 基于局部频谱特征与贝叶斯决策的脚步声识别被引量:2
- 2015年
- 针对脚步声识别系统中背景声音与噪声影响脚步声特征的提取而导致识别率明显下降的问题,根据脚步声相对背景声音在时间与频率分布上具有一定局部性的特点,提出一种声音局部频谱特征提取方法。该方法所提取的特征反映了声音主要频率成分的局部分布及其随时间的变化规律,而且对白噪声与高斯噪声的干扰有较强的鲁棒性,并且在声音采集过程中,由于与采集设备距离等因素的变化所导致的声音强度变化无关。识别过程采用贝叶斯决策理论实现步声识别。实验结果表明,该算法识别精度高于现有算法,而且对不同背景声音与环境噪声的鲁棒性明显高于现有算法。
- 余瑶郭建敏王晅
- 关键词:脚步声身份识别声谱图贝叶斯分类
- 与文本无关的单训练样本特征点提取研究
- 2016年
- 现有的说话人识别是基于语音的线性预测编码(LPCC)、Mel频率倒谱系数(MFCC)、局部归一化倒谱系数和小波包变换等特征,这些特征对环境噪声都比较敏感。针对上述问题,本文提出了一种与文本无关的单训练样本的特征提取方法。该方法提取的语音特征能够充分反映说话人的基本发声特性,可以很好的将不同的说话者区分开。本文列出了以上四种特征提取方法在但语音训练样本上对于不同说话者的识别效果,也将其与本文的方法进行了比较。对英文与汉语语音数据库的仿真实验表明,该特征提取方法可以实现单训练样本下的说话人识别中对于特征的提取,而且在单样本识别中会有相对好的效果。
- 郭建敏
- 关键词:线性预测编码MEL频率倒谱系数小波包变换
- 与文本无关的单训练样本说话人识别
- 2016年
- 针对现有的说话人识别方法对环境噪声较为敏感的问题,提出了一种与文本无关的单训练样本说话人识别方法。该方法能够提取语音时频谱的局部特征,此特征不仅对白噪声、高斯噪声、粉红噪声有很强的鲁棒性,而且能够充分反映说话人的基本发声特性。针对该局部特征的基本特点,给出了适合该局部特征的贝叶斯决策方法。对英文与汉语语音数据库的仿真实验表明,该识别方法可以实现单训练样本下的说话人识别,识别精度明显高于现有的Mel频率倒谱系数(MFCC)与线性预测编码(LPCC)语音特征,而且对白噪声等各类环境噪声有较高的鲁棒性。
- 郭建敏王晅
- 关键词:说话人识别线性预测编码MEL频率倒谱系数贝叶斯决策