林暖辉
- 作品数:10 被引量:3H指数:1
- 供职机构:广州市刑事科学技术研究所更多>>
- 发文基金:广州市科技计划项目更多>>
- 相关领域:自动化与计算机技术政治法律电子电信语言文字更多>>
- 听辨结合扩大声纹鉴定的应用范围
- 2011年
- 通过听辨可识别话者的言语特征,据此分析其语音生理特征、心理活动特征、地域职业特征等,识别说话人身份;在此基础上,结合其它声纹鉴定方法最终作出同一认定或分析意见。由于独特的技术优势,声纹鉴定技术得到越来越广泛的应用,为公安部门有效预防犯罪和快速侦破案件提供支持和帮助。
- 杨英仓欧荣安徐毓文林暖辉
- 关键词:听辨声纹鉴定
- 应用宽带语图对广州话语音进行鉴定的方法研究
- 徐毓文李培林林暖辉王国贤谭伟斌李志明
- 对广州话语音特点在声纹图中的表现进行研究,对共振峰频率、走向特征、过渡段特征等进行统计分析,所建立方法简便、快速、可靠,正识率大于99%,适合广州话语音材料鉴定,达到国际先进水平。
- 关键词:
- 融合LSTM-GRU网络的语音逻辑访问攻击检测被引量:1
- 2022年
- 为进一步提高语音欺骗检测的准确率,提出一种融合LSTM-GRU网络的语音逻辑访问攻击(语音转换、语音合成)检测方法。融合LSTM-GRU网络是由长短期记忆网络(Long short-term memory,LSTM)层、门控循环神经单元(Gated recurrent unit,GRU)层、丢弃层、批归一化层和全连接层串联结合的一种混合网络,其中LSTM层可以解决语音序列中的长时依赖问题,GRU层则可降低模型参数量。实验在ASVspoof2019 LA数据集上进行,提取20维的梅尔倒谱系数特征用于模型训练,在测试阶段使用训练好的LSTM-GRU模型对测试集中的语音进行欺骗检测。与GRU网络及LSTM网络的比较结果表明:LSTM-GRU网络在3种网络模型中正确识别率最高,等错误率(Equal error rate,EER)比ASVspoof2019挑战赛所提供基线系统低27.07%,对逻辑访问攻击语音检测的平均准确率达到98.04%,并且融合LSTM-GRU网络具备训练时间短、防止过拟合及稳定性高等优点。结果证明本文方法可有效应用于语音逻辑访问攻击检测任务中。
- 杨海涛王华朋牛瑾琳楚宪腾林暖辉
- 刑侦录音取证方法研究
- 徐毓文林暖辉李文瑞赵伟范恒胜张伟颂周隽文韩冰
- 该项目以专业监听音箱播放的同一段语音作为声源,针对各种常见录音器材、录音环境及录音方式设计录音方案录制语音样本,并将这些语音样本通过声纹仪转化成声纹图谱和特征参数,应用比较、分析、总结的方法,研究了非发声器官造成的声纹变...
- 关键词:
- 关键词:录音器材
- 基于CT数据的中国人三维颅面复原系统的研究
- 袁中标刘超温锦锋裴玉茹戴维列李文瑞汪冠三徐毓文周隽文肖凯可曾素明徐磊吴云山罗慧恒徐国林范恒胜张伟颂林暖辉赵伟韩冰
- 1、该项目通过CT采集250例活体头面部的分层数据,并对其进行颅面重建,研究颅骨结构形态与真人面貌的对应关系;通过对300例头骨、5000例中国各省人的头面部特征各项数据指标进行观察、测量、统计,确定颅骨与面型的分类。2...
- 关键词:
- 关键词:软件系统
- 浅议声纹鉴定中噪声对语音频谱特征的影响及降噪处理被引量:2
- 2015年
- 在介绍噪声特性的基础上探讨声纹鉴定中噪声对语音频谱特征的影响,及常用降噪方法。噪声对语音的基音频率、共振峰频率等会产生不利干扰,干扰程度与噪声强度有关。正确认识噪声对语音的影响,能便于在声纹鉴定中合理判断检材语音与样本语音的差异是本质差异还是噪声影响差异。
- 林暖辉张伟颂徐毓文
- 关键词:声纹鉴定噪声降噪
- 基于卷积神经网络的说话人识别方法
- 2022年
- 为进一步提高说话人识别的准确率,提出一种新的基于卷积神经网络的说话人识别方法。利用卷积神经网络强大的处理图像能力可有效提高说话人识别的准确率。卷积神经网络相对于其他网络结构简单,训练时间较短且准确率较高。该方法首先对语音信号进行了预处理,包括重采样、分帧、加窗等操作,然后提取梅尔频率倒谱系数,之后送入卷积神经网络进行训练。通过LibriSpeech标准库和中文数据库测试表明,本算法识别率达到95%,可有效进行说话人识别。
- 楚宪腾王华朋杨海涛林暖辉
- 关键词:卷积神经网络说话人识别
- 基于卷积循环神经网络的语音逻辑攻击检测
- 2022年
- 语音合成和语音转换等技术正逐渐成为合成语音的主流方法,合成语音对社会稳定和国家安全都具有潜在的风险。为进一步提高合成、转换伪造语音检测的准确率,从混合网络模型,特征选择出发,提出了基于CNN-RNN-DNN网络的3种混合网络模型,分别为CNN-LSTM-DNN、CNN-GRU-DNN、CNN-BiLSTM-DNN。模型中卷积神经网络(convolutional neural network,CNN)部分可以进行下采样,循环神经网络(recurrent neural network,RNN)部分解决语音中的时序问题,深度神经网络(deep neural network,DNN)部分则实现分类功能。每种混合网络模型包含20层网络层。对提取的6种声学特征进行实验,其中CNN-LSTM-DNN+MFCC的组合表现最优,等错误率为5.79%,比ASVspoof2019提供的B02基线系统低28.43%。比较了3种混合网络结合6种特征的表现并增加了其与4种单独网络的对照实验,结果表明本文提出的混合网络模型具有性能稳定、准确率高等优点且梅尔频率倒谱系数(mel-frequency cepstral coefficients,MFCCs)特征及混合梅尔倒谱系数线性频率倒谱系数(linear frequency cepstral coefficient,LFCC)特征更适合此模型。
- 杨海涛王华朋楚宪腾牛瑾琳林暖辉张琨瑶
- 从人身分析角度浅谈广东粤语分布及语音特点
- 由于历史社会文化发展的差异,造成粤语语音具有许多鲜明的地域特点。粤语在广东范围可分为广府片、四邑片、高阳片、罗广片和吴化片等五个片,这些方言片体现在声韵调三方面的语音特点具有明显的地域差异性,为人身分析提供条件和依据。
- 林暖辉徐毓文欧荣安
- 关键词:粤语语音特点
- 文献传递