董桂官
- 作品数:32 被引量:37H指数:5
- 供职机构:中国电子技术标准化研究院更多>>
- 发文基金:国家自然科学基金内蒙古自治区自然科学基金国家高技术研究发展计划更多>>
- 相关领域:电子电信自动化与计算机技术政治法律经济管理更多>>
- 基于改进池化层的弱标记声音事件检测被引量:5
- 2021年
- 针对DCASE2017挑战赛任务4提供的大规模弱标记声音事件检测数据集,我们搭建了基于梅尔滤波器特征(Fbank)、卷积神经网络(CNN)以及循环神经网络(RNN)的多类别声音事件检测系统,分析了attention和linear softmax两种已有的常用池化层在神经网络反向传播中的部分推演过程,并在linear softmax池化层的基础上进行改进,提出了一种"指数可学习的幂函数softmax"池化层。实验结果表明,相比于DCASE竞赛中获得第一名的模型,应用"指数可学习的幂函数softmax"池化层的检测系统,将段级别的声音事件预测的F1值从0.556提高到0.652,帧级别预测的F1值从0.518提高到0.583,帧级别预测的error rate(ER)从0.730降低到0.667。
- 刘淼王晶董桂官易伟明
- 基于多尺度特征融合的语音频带扩展
- 2023年
- 针对现有的深度学习模型在语音频带扩展领域数据特征利用不充分、训练周期长以及生成语音质量不高等问题,提出了一种新型的端到端神经网络模型,该模型通过融合不同数据维度特征促使网络模型利用更少的数据特征量,获取更多的低高频映射关系解,从而减少模型的整体训练周期.为了提高长时序数据中关键特征的权重占比,设计了一种残差多头自注意力机制,从而达到数据特征利用率的最大化.此外,提出了一种基于时频域和Mel频谱的混合损失函数对模型进行优化.实验结果表明:该方法重构的宽带语音在主客观的评价中均优于传统方法和近年来的一些基于神经网络的语音频带扩展方法.
- 许春冬朱诚应冬文董桂官
- 宽辐射角六声源至九声源扬声器阵列
- 宽辐射角六声源至九声源扬声器阵列,将幅度和相位不同的信号馈给按序排列的六至九个相同的扬声器,来实现六声源至九个声源扬声器的阵列指向性的优化,所述的六声源至九声源扬声器阵列一般指横向直线排列或近似直线的六至九个声源。六声源...
- 沈勇董桂官夏洁安康杨小军
- 文献传递
- 一种计算测试信号的输入格式的方法、设备及信号发生器
- 本发明公开了一种计算测试信号的输入格式的方法,该方法适于为不同的虚拟现实或增强现实头显设备适配不同输入格式的测试信号,包括步骤:获取虚拟现实或增强现实头显设备的接口信息;从接口信息中提取表征该虚拟现实或增强现实头显设备性...
- 董桂官贾凯周阳翔韩少晖阮向远
- 三维音频质量评价方法
- 2017年
- 随着三维(Three Dimension,3D)音频技术的发展,与之相配合的三维音频质量评价方法也越来越受到广泛的关注。当前的三维音频质量评价方法主要包括两大类:主观评价方法与客观评价方法。主观评价由于其直观性和可靠性而成为音频质量评价的黄金标准,主要包括ITU国际标准中的带隐藏参考和基准的多激励测试(MUSHRA,ITU-R BS.1534)以及带隐藏参考的三次听音双盲听评法(ITU-R BS.1116)。主观评价方法认可度高,但操作耗时耗力,研究者也希望开发一种快速方便的客观评价工具。目前国际标准中针对音频信号的客观模型主要是感知音频质量客观测试方法(PEAQ),但相较于主观评价方法,它的准确度仍不是很理想,尤其是在针对多声道的三维音频质量进行评价时缺少很好的解决方案。本文对目前主要的三维音频质量主客观评价标准进行了阐述和分析,并提出一种改进的基于双层结构和数据挖掘方法的三维音频质量客观评价模型,其准确度优于现有的PEAQ方法。
- 刘继月王晶谢湘董桂官
- 关键词:主观评价数据挖掘
- 宽指向性声梁的应用
- 利用QR时间延迟、QR相位延迟、采用sinc函数理论或二次剩余序列设置阵列等方法对多点激励源的声梁水平方向指向性进行优化,指向性与声功率级二者兼顾,声梁在偏离轴线方向其频率响应也随之得到改善;经过优化后得到的宽指向性声梁...
- 刘云峰沈勇董桂官蒋伟
- 关键词:扬声器阵列
- 智能电视中文语音识别测试研究被引量:5
- 2014年
- 在目前中文语音识别的研究与应用基础上,提出了针对智能电视产品的语音识别测试方案。该测试方案基本覆盖了智能电视这一产品类型语音识别功能与性能的主要测试指标,测试结果的分析反映了目前智能电视语音识别应用的技术现状;测试过程与结果也验证了该方案的实用性和有效性。
- 董桂官刘云徐楠
- 关键词:智能电视语音识别
- 宽辐射角六声源至九声源扬声器阵列
- 宽辐射角六声源至九声源扬声器阵列,将幅度和相位不同的信号馈给按序排列的六至九个相同的扬声器,来实现六声源至九个声源扬声器的阵列指向性的优化,所述的六声源至九声源扬声器阵列一般指横向直线排列或近似直线的六至九个声源。六声源...
- 沈勇董桂官夏洁安康杨小军
- 《智能电视 智能化技术评价方法》标准解读被引量:3
- 2018年
- 分析了智能电视智能化方面的国内外标准化现状,详细解读了SJ/T 11688-2017《智能电视智能化技术评价方法》的使用范围,智能电视智能化技术的评价条件、项目及方法,并针对标准制定时开展的摸底测试进行分析,有利于指导消费者选购智能电视产品,并引导智能电视产业的有序发展。
- 徐楠曹新凤韩少晖周阳翔董桂官阮向远
- 关键词:智能电视智能化人工智能
- 扩展现实(XR)标准体系研究
- 2024年
- 针对扩展现实(XR)领域顶层架构不清晰、标准体系不完善等问题,通过整合虚拟现实(VR)、增强现实(AR)和混合现实(MR)等XR技术,结合产业发展需求,构建了覆盖基础通用、内容生产、内容分发、内容呈现与交互、测试和质量评价、安全、行业应用7个部分的体系框架,通过加强标准体系顶层设计和明确标准化重点领域与方向,持续推动XR技术与各行业的深度融合,有助于提高技术互操作性、降低成本、提升产品质量,实现产业健康、有序和可持续发展。
- 耿一丹潘榕董桂官李婧欣曾洁琪
- 关键词:虚拟现实