您的位置: 专家智库 > >

国家自然科学基金(61105076)

作品数:5 被引量:36H指数:2
相关作者:陈雁翔汪海波李艳秋任洪梅程小雪更多>>
相关机构:合肥工业大学上海师范大学更多>>
发文基金:国家自然科学基金中国博士后科学基金安徽省自然科学基金更多>>
相关领域:自动化与计算机技术电子电信更多>>

文献类型

  • 5篇中文期刊文章

领域

  • 3篇自动化与计算...
  • 2篇电子电信

主题

  • 2篇人脸
  • 2篇人脸识别
  • 2篇神经网
  • 2篇神经网络
  • 1篇单训练样本
  • 1篇音频
  • 1篇语音
  • 1篇语音合成
  • 1篇人脸识别方法
  • 1篇声谱图
  • 1篇识别方法
  • 1篇情感
  • 1篇情感特征
  • 1篇主成分
  • 1篇主成分分析
  • 1篇网络
  • 1篇卷积
  • 1篇卷积神经网络
  • 1篇RECOGN...
  • 1篇SUPPOR...

机构

  • 4篇合肥工业大学
  • 1篇上海师范大学

作者

  • 4篇陈雁翔
  • 1篇刘磊
  • 1篇李艳秋
  • 1篇汪海波
  • 1篇程小雪
  • 1篇任洪梅
  • 1篇龙润田

传媒

  • 3篇合肥工业大学...
  • 1篇模式识别与人...
  • 1篇Journa...

年份

  • 1篇2016
  • 2篇2015
  • 1篇2013
  • 1篇2012
5 条 记 录,以下是 1-5
排序方式:
EMOTIONAL SPEECH RECOGNITION BASED ON SVM WITH GMM SUPERVECTOR被引量:1
2012年
Emotion recognition from speech is an important field of research in human computer interaction. In this letter the framework of Support Vector Machines (SVM) with Gaussian Mixture Model (GMM) supervector is introduced for emotional speech recognition. Because of the importance of variance in reflecting the distribution of speech, the normalized mean vectors potential to exploit the information from the variance are adopted to form the GMM supervector. Comparative experiments from five aspects are conducted to study their corresponding effect to system performance. The experiment results, which indicate that the influence of number of mixtures is strong as well as influence of duration is weak, provide basis for the train set selection of Universal Background Model (UBM).
Chen YanxiangXie Jian
基于PAD情感模型的可训练语音合成研究被引量:1
2013年
情感语音合成是情感计算和语音信号处理研究的热点之一,进行准确的语音情感分析是合成高质量情感语音的前提.文中采用PAD情感模型作为情感分析量化模型,对情感语料库中的语音进行情感分析和聚类,获得各情感PAD参数模型.由HMM语音合成系统合成的情感语音,通过PAD模型进行参数修正,使得合成语音的情感参数更加准确,从而提高情感语音合成的质量.实验表明该方法能较好地提高合成语音的自然度和情感清晰度,在同性别不同说话人中也能达到较好的性能.
陈雁翔龙润田
关键词:参数修正情感特征
基于主成分分析和Softmax回归模型的人脸识别方法被引量:29
2015年
文章介绍一种基于主成分分析(principal component analysis,PCA)和Softmax回归模型相结合的人脸识别方法,该方法通过PCA对整幅图像提取特征,然后将提取的特征经过非线性变换输入到Softmax回归模型中。将主成分提取特征看成是单层神经网络,将它与Softmax回归模型构成的级联结构看作是2层神经网络,在神经网络的训练过程中,主成分的特征向量可以微调。在不同人脸数据库上的实验表明,相比于传统的只用PCA降维的方法,本文方法可达到较高的识别率。
汪海波陈雁翔李艳秋
关键词:人脸识别主成分分析神经网络
基于特征关联性的人脸高层特征研究被引量:1
2015年
在特殊应用领域,注册者只能注册一张人脸信息,使得人脸注册信息极为有限,给人脸识别带来很大的限制。文章以参考集为基础,开展了基于特征关联性的人脸高层特征研究,通过对参考集中该人脸的所有图片特征均值和训练集、测试集中数据进行距离计算,将对应训练集、测试集中的各人脸的距离依次组合构成向量作为该脸的高层特征,该方法在很大程度上解决了注册信息缺失的问题;在Multi-PIE库和扩展YaleB库中进行了实验,并与基于稀疏表示的分类(sparse representation-based classifier,SRC)算法进行了对比。实验表明:该算法比余弦距离分类方法人脸识别的正确率提高5%~6%;与SRC算法相比,该算法更具有优越性。研究结果对单训练样本条件下的人脸识别研究有一定作用。
陈雁翔刘磊
关键词:人脸识别单训练样本
声谱图显著性在音频识别中的应用被引量:4
2016年
针对嘈杂背景、混叠、间断或多源的复杂音频,传统音频识别存在一定的局限性。文章提出了一种基于声谱图显著性检测的音频识别方法,将音频可视化转化为二维声谱图图像,利用图像的显著性检测有效获得声谱图中的主声源区域,并去除声谱图中与主声源无关的信息;然后针对主声源区域提取特征,以减少干扰并降低冗余度;采用改进的卷积神经网络(convolutional neural network,CNN)实现音频识别。实验结果表明,该方法可以有效解决复杂音频的识别问题。
弓彦婷程小雪任洪梅陈雁翔
关键词:声谱图
共1页<1>
聚类工具0