王年松
- 作品数:4 被引量:2H指数:1
- 供职机构:安徽省公安厅更多>>
- 发文基金:安徽省自然科学基金更多>>
- 相关领域:自动化与计算机技术政治法律电子电信更多>>
- 图像真实性检验案件一例
- 随着违法犯罪多元化的发展,基层公安机关办理的图像检验案件数呈上升趋势,但是由于多数基层公安机关检验条件及检验水平有限,目前还开展不了图像检验工作。近期,笔者办理一起涉及图像真伪检验案件,通过对涉案照片的图像信息进行综合分...
- 吴刚樊迅王年松
- 关键词:案件侦查
- 基于Group-Res2Block的智能合成语音说话人确认方法
- 2024年
- 针对现有说话人确认任务基于自然语音条件下并不适用于智能合成语音的问题,提出一种基于Group-Res2Block的智能合成语音说话人确认方法。首先,设计了Group-Res2Block结构,在Res2Block的基础上将当前分组与相邻前后分组进行合并形成新的分组,以增强说话人局部特征的上下文联系;其次,设计了并行结构的多尺度通道注意力特征融合机制,利用不同大小卷积核实现同一层级的特征在通道维度的特征选择,以获取更具表现力的说话人特征,避免信息冗余;最后,设计了串行结构的多尺度层注意力特征融合机制,构建层结构,将深浅层特征整体进行融合并赋予不同权重,以获取最优的特征表达。为验证所提出特征提取网络的有效性,构建了中英文两种智能合成语音数据集进行消融实验和对比实验。结果表明本文方法在该任务的评价指标精确度(accuracy,ACC)、等错误率(equal error rate,EER)和最小检测代价函数(minimum detection cost function,minDCF)上是最优的。此外,通过对模型泛化性能进行测试,验证了本文方法对未知智能语音算法的适用性。
- 李菲苏兆品王年松杨波张国富
- 关键词:说话人确认多尺度特征
- 基于深度声纹特征转换网络的说话人识别攻击方法
- 2024年
- 目前主流说话人识别(speaker identification,SID)系统的攻击方法主要基于快速梯度下降或映射式梯度下降算法,这些方法存在攻击效果不稳定、生成的攻击语音听觉质量不高等问题。为此提出一种基于深度声纹特征转换网络的自动说话人识别攻击方法,生成具有目标说话人音色的攻击语音。首先分析了SID系统的攻击流程,确定了攻击语音生成的过程;然后基于二维卷积神经网络设计攻击音频生成器,以有效融合源说话人的语音内容和目标说话人的声纹特征,并基于对抗学习设计了攻击音频的判别器,以提高语音攻击音频的质量。最后分别在基于广义端到端损失和基于AMSoftmax损失的两个自动说话人识别系统上进行对比实验。实验结果表明,所提方法不但提高了攻击效果的稳定性,提升了攻击音频的人耳感受质量,而且适用于短时长数据,满足了实际攻击场景的需求。
- 陶子钰苏兆品廉晨思王年松王年松
- 关键词:说话人识别卷积神经网络
- 采用深层神经网络中间层特征的关键词识别被引量:2
- 2015年
- 在基于模板匹配的关键词识别中,提出采用深层神经网络的中间层特征(bottleneck,BN)作为特征输入,将其取代传统的声学参数来生成后验概率图.首先采用传统语音识别的过程训练一个中间层很窄的深层神经网络,将所有的语音特征经过这个神经网络后得到稳健的BN特征;然后利用混合高斯模型将BN特征转化成后验概率图;在识别过程中,利用后验概率图作为特征参数,采用简化的分段动态时间规整算法实现关键词匹配.在TIMIT数据库上,相对于采用传统感知线性参数的系统,采用BN特征的系统,识别准确率有30%的提升.
- 刘学王年松郭武
- 关键词:中间层