您的位置: 专家智库 > >

广西壮族自治区自然科学基金(2010GXNSFA013128)

作品数:8 被引量:8H指数:2
相关作者:胡维平高俊芬赵冰心甘德英董振华更多>>
相关机构:广西师范大学柳州铁道职业技术学院更多>>
发文基金:广西壮族自治区自然科学基金国家自然科学基金更多>>
相关领域:电子电信自动化与计算机技术医药卫生更多>>

文献类型

  • 8篇中文期刊文章

领域

  • 3篇电子电信
  • 3篇自动化与计算...
  • 2篇医药卫生

主题

  • 3篇支持向量
  • 3篇支持向量机
  • 3篇向量
  • 3篇向量机
  • 3篇非线性动力
  • 3篇非线性动力学
  • 2篇混合模型
  • 2篇高斯
  • 2篇高斯混合
  • 2篇高斯混合模型
  • 2篇GMM
  • 1篇单次
  • 1篇元音
  • 1篇声学
  • 1篇声学特征
  • 1篇说话人识别
  • 1篇特征提取
  • 1篇频域
  • 1篇滤波器
  • 1篇滤波器组

机构

  • 7篇广西师范大学
  • 1篇柳州铁道职业...

作者

  • 6篇胡维平
  • 3篇高俊芬
  • 2篇赵冰心
  • 1篇李姮
  • 1篇陈承义
  • 1篇甘德英
  • 1篇董振华

传媒

  • 2篇广西师范大学...
  • 2篇生物医学工程...
  • 1篇计算机工程与...
  • 1篇中国生物医学...
  • 1篇广西物理
  • 1篇Journa...

年份

  • 1篇2014
  • 3篇2013
  • 2篇2012
  • 2篇2011
8 条 记 录,以下是 1-8
排序方式:
传统声学特征和非线性特征用于病态嗓音的比较研究被引量:3
2014年
本文通过分析嗓音的发音机制,提取正常与病态嗓音的传统声学参数[基频、Mel倒谱系数(MFCC)、线性预测系数(LPCC)、频率微扰、振幅微扰]与非线性动力学特征参数[熵(样本熵、模糊熵、多尺度熵)、计盒维数、计维截距和Hurst参数],作为病态嗓音识别的特征矢量集。应用支持向量机(SVM)对/a/音的78例正常嗓音与73例病态嗓音和/i/音的78例正常嗓音与80例病态嗓音进行建模与识别。结果表明,相对于传统的声学特征参数,非线性特征参数能更好地区分正常与病态嗓音;实验提取的所有参数中,除了多尺度熵,/a/音的正常与病态嗓音的识别率均高于/i/音,因此为了达到识别病态嗓音的目的,国内外相关研究大多采用/a/音数据;多尺度熵特征对/i/音的正常与病态嗓音的识别率较/a/音高,它或能为评价声带代偿功能状态的研究提供有益的启发。
甘德英胡维平赵冰心
关键词:支持向量机
基于非线性动力学和高斯混合模型/支持向量机的病态嗓音识别与研究被引量:4
2012年
传统的病态嗓音的识别研究中,通常采用线性分析技术分析嗓音的特性,将嗓音产生过程用一个经典的线性模型来近似,然而,这样却忽略了嗓音产生过程中的非线性特性。本文基于非线性动力学的分析方法,定量分析并提取了嗓音的7维非线性特征——Hurst参数、时间延迟、第二阶Rényi熵、香农熵、关联维、Kolmogorov熵(K熵)、最大Lyapunov指数。实验结果表明,非线性动力学的方法能够弥补传统分析方法的不足,较好分析正常与病态嗓音;应用高斯混合模型(GMM)和支持向量机(SVM)的模式识别方法,分别对测试集39例正常嗓音和36例病态嗓音进行识别,均得到较好的识别率,分别为97.22%和97.30%。
高俊芬胡维平
关键词:非线性动力学高斯混合模型支持向量机
病态嗓音的识别与研究
2013年
通过分析嗓音的发音机理,提取正常与病态嗓音的传统声学参数:基频、共振峰、Mel倒谱系数(MFCC),以及非线性特征参数:计盒维数与截距,作为病态嗓音识别的特征矢量集。应用高斯混合模型(GMM)对156例正常嗓音与146例病态嗓音进行建模与识别。结果表明:非线性特征参数计盒维数与截距能很好地区分正常与病态嗓音,它们与传统声学参数基频和共振峰的组合,能够取得92.60%的识别率。
陈承义高俊芬
关键词:高斯混合模型截距
基于GMM的说话人识别
2011年
通过运用mat1ab软件编程对语音信号进行了基音提取,并以MFCC、基于基音周期和MFCC的特征组合参数作为特征参数,建立了基于GMM模型的说话人识别系统。并通过识别实验得出的实验结果,发现使用基于基音周期和MFCC的特征组合参数作为特征参数,在人数为50-180人范围内,能够有效提高基于GMM说话人识别系统识别率。
李姮胡维平
关键词:说话人识别特征提取MFCC基音周期
基于熵和支持向量机的病态嗓音识别被引量:1
2013年
为了更好地分析实际短数据带噪的病态嗓音信号,利用近年来提出的样本熵、多尺度熵、模糊熵和分层熵的方法来提取嗓音的熵特征参数,并借鉴分层分解方法,提出分层多尺度熵和分层模糊熵,分别对测试集39例正常嗓音和36例病态嗓音进行支持向量机(SVM)识别。实验结果表明:三层分层熵、分层多尺度熵、分层模糊熵的识别率和稳定性均较分层前有提高。在耗时较短的情况下,提取2 000点病理嗓音数据的6种熵特征都能达到较好且较稳定的识别率。提取2 000点病理嗓音数据的三层分层模糊熵特征,能得到较好且较稳定的SVM识别率97.33%,较分层前的模糊熵特征识别率提高约4.00%。熵分析方法可推进病态嗓音研究向临床的应用,为临床分析诊断实时、短数据的带噪病理嗓音提供一定的参考。
赵冰心胡维平
关键词:模糊熵支持向量机
EMD的单次分解频域属性及IMF的生成机理研究
2012年
本文通过使用2个单频率信号的组合应用于EMD分解来研究EMD的单次分解的频域属性和探索研究本征模态函数IMF的生成机理。数值实验结果证明,EMD过程中,信号中的最高频率组分通过抽取相对低频信号而生成IMF并决定其频域位置和带宽,数值实验结果也证明了EMD过程中相对高频分量对低频分量的抽取能力的非传递属性,最后给出单次EMD的频域滤波器组结构的示意图,并讨论了EMD和小波的频域结构的异同。
胡维平董振华
关键词:经验模态分解
基于非线性动力学和GMM的病态嗓音识别与研究被引量:2
2011年
本文采用非线性动力学的分析方法,定量分析并提取了正常与病态嗓音的5维非线性特征:Hurst参数、香农熵、计盒维数、Kolmogorov熵和关联维数;使用来源于临床病例的151例数据,选用高斯混合模型GMM(gaussian mixture model)的模式识别方法,来评估基于非线性动力学分析方法所提取的特征参数的有效性。实验结果表明,非线性动力学的分析方法能够弥补传统分析方法的不足,较好分析正常与病态嗓音,取得96.05%的较好识别率。
高俊芬胡维平
关键词:非线性动力学GMM
A new formant feature and its application in Mandarin vowel pronunciation quality assessment
2013年
In order to improve the Mandarin vowel pronunciation quality assessment, a novel formant feature was proposed and applied to formant classification for Chinese Mandarin vowel pronunciation quality evaluation. Formant candidates of each frame were plotted on the time frequency plane to form a bitmap, and its Gabor feature was extracted to represent the formant trajectory. The feature was then classified by using GMM model and the classification posterior probability was mapped to pronunciation quality grade. The experiments of comparing the Gabor transformation based formant trajectory feature with several other kinds of traditionally used features show that with this method, a human-machine scoring correlation coefficient(CC) of 0.842 can be achieved, which is better than the result of 0.832 by traditional speech recognition techniques. At the same time, considering that the long-term information of formant classification and the short-term information of speech recognition technique are complementary to each other, it is investigated to combine their results with linear or nonlinear methods to further improve the evaluation performance. As a result, experiments on PSK show that the best CC of 0.913, which is very close to the correlation of inter-human rating of 0.94, is gotten by using neural network.
卢小春潘复平尹俊勋胡维平
关键词:元音GABOR变换
共1页<1>
聚类工具0