杨毅 作品数:27 被引量:74 H指数:5 供职机构: 北京科技大学 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 北京市自然科学基金 更多>> 相关领域: 电子电信 文化科学 自动化与计算机技术 交通运输工程 更多>>
基于媒体认知课程的人工智能人才培养方法探索 被引量:1 2018年 1背景
随着电子信息技术日新月异,电子信息教学领域也面临着全新的挑战,需要培养具有全方位视野和超强能力的新一代工程师及领导者。媒体与认知是清华大学电子信息学科在课程体系改革过程中提出的一门重要的必修课程。结合清华大学电子工程系在该领域研究的基础、优势和创新性成果,我们有针对性地将已有科研成果转化为教学内容. 杨毅 颜历 王生进 乔飞关键词:人脸表情 表情识别 卷积神经网络 基于子带频谱质心特征的高效音频指纹检索 被引量:5 2017年 关键音频检测是指从音频库中检索出查询样例,是音频检索的一种重要形式。该文针对传统关键音频检测方法在效率和鲁棒性上的不足分别在预处理、指纹提取以及检索部分进行了优化。在预处理阶段采用基于子带能量比的语音端点检测算法,并在窗函数选择和子带划分方法上进行了改善;在指纹提取阶段采用种子片段选取的方法,并将指纹提取方法改进为子带频谱质心法;在检索阶段通过设定命中次数门限以提高效率。实验结果表明:该文提出的改进系统在查全率、查准率以及抗噪能力提升的同时提高了检索效率,有效地提升了检索性能。 孙甲松 张菁芸 杨毅关键词:指纹提取 端点检测 基于NIST评测的说话人分类及定位技术研究 2011年 该文针对美国国家标准与技术研究院(NIST)的NIST评测,构建了一套多距离麦克风说话人分类及定位语音处理系统,针对NIST富标注评测中提出的说话人分类问题,提出改进的结合时延估计和聚类的说话人分类方法,在保证稳定性的前提下降低说话人分类的复杂度并提高准确率;提出一种新的相邻阵元间时延构造矩阵方程算法,可得到多个说话人的方向角。实验在标准会议环境下采集真实语音数据进行算法验证,说话人分类算法的正确率接近目前主要说话人分类系统的正确率,定位方向角误差在3°以内。实验结果说明,适当条件下多距离麦克风系统可作为合适的语音信号输入设备应用于多人多方会议环境。 杨毅 宋辉 刘加基于鲁棒波束形成的麦克风阵列系统 2008年 为了提高噪声消除的鲁棒性,传统的通用旁瓣消除器采用固定波束形成作为输出的系数约束自适应滤波器,采用CCAF的输出作为输入的标准约束自适应滤波器。此系统的跟踪性能随信号频率变化而改变,并且由于波束带宽的影响使得目标语音在低频发生畸变。采用优化波束形成方法来得到较宽的带宽,对输出进行后滤波处理来消除残余噪声。试验表明本方法可明显提高语音信噪比。 杨毅 余达太 宋辉 刘加关键词:麦克风阵列 波束形成 基于多路线性预测技术的时延估计 被引量:2 2011年 很多麦克风阵列时延估计算法在噪声和混响环境下性能都会下降。该文提出一种基于多路线性预测(multi-ple linear prediction,MLP)的时延估计算法。通过传递函数比估计来消除通道间传递函数的非对称性,提高信号相关程度;空间预测技术引入了阵列冗余信息,并以相关系数矩阵作为时延搜索的目标函数,提高时延估计的可靠性。实验结果显示了多路线性预测算法的估计准确率更高,性能更加稳健。与几种经典算法相比,在噪声和混响环境下MLP算法的估计正确率分别提高了5%和30%以上。 宋辉 杨毅 刘加关键词:麦克风阵列 时延估计 语音信号处理实验的改革与实践 被引量:13 2014年 随着数字信号处理的发展,语音信号领域越来越受到关注,语音信号处理是实现人机交互和通讯技术的必要方法。语音信号处理教学实验课程在国外著名大学已经得到广泛开设。本文介绍了一门最新开设的将基础知识与理论研究相结合的语音信号处理实验课程。该课程主要由一系列由浅入深的语音信号处理实验构成,通过这些实验,使学生深入理解语音信号领域的前沿知识。在自主实验环节,学生自主提出实验题目及内容,通过小组形式完整地完成一个项目的设计、开发和汇报过程。本文将一个小组的语音分离项目为例,来说明该课程不仅能够培养学生的动手和分析解决问题能力,并能激发学生对相关领域的研究兴趣。 杨毅 李泽伟 邓北星 马晓红关键词:语音信号处理 教学实验 基于空间声学特征的说话人分类算法 2013年 针对先验信息缺失情况下的说话人分类问题,可以采用提取基于多距离麦克风的空间声学特征的方法进行说话人分类.为了解决由于空间声学特征维数随麦克风个数的增加而迅速增长带来的计算代价问题,需要对其进行降维处理.用一种基于空间声学特征的优化鉴别式保局投影说话人分类方法,实现了在保留空间声学特征流型结构的同时降低计算代价的效果.实验在多距离麦克风语音会议数据集上进行验证,得到在大部分数据集上本方法的分类误差率(diarization error rate,DER)得分低于传统方法的结果.结果表明:本方法的说话人分类性能比传统方法有所提高. 杨毅 陈国顺 鲍长春麦克风阵列应用于鲁棒自适应噪声消除 2007年 提出一种应用于鲁棒自适应噪声消除的新结构,用优化波束形成方法取代GSC中的固定波束形成(Fixed Beamforming)以得到较宽的带宽;对GSC的输出进行后滤波处理消除残余噪声。 杨毅 余达太 宋辉 刘加关键词:麦克风阵列 波束形成 媒体认知实验教学理念与实践研究 2015年 媒体与认知实验课程是清华大学电子工程系在课程改革中提出的一门全新的核心必修课程。文章首先阐述该课程的特点,然后介绍基于英特尔Real Sense设备及微软Kinect设备开发的一套探索前沿型实验教学平台,分别说明基于手势识别的博弈游戏实验项目和基于姿势识别的组合拍照实验项目,指出通过这些前沿的基于交叉学科的智能感知技术和内容,学生可以掌握成为本领域高层次专业人才必需的各项基本技能和专业知识。 杨毅 徐淑正 乔飞 王靖淇 王生进关键词:智能感知 人机交互 媒体认知实验教学改革研究与探索 被引量:3 2015年 媒体认知实验课程是清华大学电子信息学科在课程体系改革过程中提出的一门创新性前沿必修课程。文章阐述全面覆盖人机感知交互、媒体信息处理、虚拟现实及信号处理领域的一套基于英特尔Real Sense设备的探索前沿型实验教学课程内容及平台特点,分别介绍三维手势识别实验项目和三维虚拟交互行为分析实验项目,旨在培养学生的智能感知技术开发能力,掌握成为感知技术前沿领域高层次专业人才必需的各项基本技能和专业知识,采用集体创新培养和个人研究探索相结合,最终达到理工与人文、技术与艺术、感知与思考的高度融合。 杨毅 徐淑正 乔飞 王靖淇 王生进关键词:智能感知 人机交互