叶迎宪
- 作品数:11 被引量:12H指数:2
- 供职机构:南京大学电子科学与工程学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 基于小波变分辨率频谱特征的静音检测被引量:2
- 2009年
- 针对静音检测提出基于小波变分辨率频谱特征的检测算法。算法采用多门限过零率对静音进行初判,并提取多个语音感觉特征与基于小波变分辨率频谱的Mel频率倒谱系数(MFCC)组合成语音特征,通过二分类支持向量机对该特征进行分类实现静音检测。测试结果表明,该算法在不同信噪比下语音识别正确率高于G.729b,MFCC特征静音检测算法,基于该算法的视频会议服务器运算量低于使用G.729b静音检测算法的视频系统。
- 薛卫都思丹叶迎宪
- 关键词:静音检测小波支持向量机
- 基于语音特征判别的静音检测方法
- 本发明公开了一种基于语音特征识别的静音检测方法,首先提取一帧音频数据的多门限过零率;用加权多门限过零率对静音进行预判,判别出明显的静音;提取一帧音频数据的复合特征,复合特征包括过零率、短时能量值、基于变分辨率频谱的Mel...
- 都思丹薛卫周余孔令红叶迎宪赵康涟
- 文献传递
- 支持大容量混音的同声传译视频会议系统及方法
- 本发明公开了一种支持大容量混音的同声传译视频会议系统及方法,提出了基于Mel尺度倒谱特征与支持向量机静音检测方法、大容量混音方法和同声传译方法。可以实现更高的静音检测率、比其它混音方法更多的混音路数和在同一会议室进行多语...
- 都思丹薛卫周余叶迎宪刘红星
- 文献传递
- 基于线性插值填充的帧内运动补偿被引量:2
- 2008年
- 帧内运动补偿被认为是H.264/AVC中具有潜力的改进方向之一。提出了一种线性插值填充算法来改进帧内运动补偿的编码效率。与Dong等人提出的自适应填充算法相比,线性插值填充能更精确地预测出填充区域内的像素,从而使得帧内运动补偿效率更高。实验测试表明,基于线性插值填充的改进算法可以使帧内运动补偿块数量增加4.58%~84.7%,从而令帧内编码的率失真性能得到提高。
- 叶迎宪都思丹
- 关键词:H.264/AVC帧内编码线性插值
- 一种基于H.264与近邻预测的无损视频压缩H.264-LS被引量:3
- 2006年
- 提出了一种无损视频压缩方案H.264-LS。该方案为适应无损压缩的需要,根据运动补偿后残差系数的特点,使用了一种二维近邻预测技术以取代H.264原有的变换。实验测试结果表明,该算法的整体表现要优于现有的一些无损视频压缩方案,特别是对于运动量大的视频序列优越性很突出。
- 叶迎宪都思丹
- 关键词:H.264
- 一种基于3D-DCT及帧内预测的静态彩色图像压缩方法JPC3D
- 一种基于3D-DCT及帧内预测的静态彩色图像压缩方法-JPC3D。所属的技术领域:数字图像处理之编码技术解决的技术问题:降低静态图像压缩的复杂度,同时保持画面细节纹理,达到由于JPEG2000的效果解决该问题的技术方案的...
- 都思丹叶迎宪薛卫袁杰高敦堂刘红星
- 文献传递
- 基于变分辨率频谱特征的向量机静音检测和实时混音技术被引量:3
- 2006年
- 静音检测算法基于两个语音感觉特征与变分辨率频谱的Mel频率倒谱系数组合成音频特征,采用多门限过零率对静音进行初判,并通过二分类支持向量机对组合语音特征进行分类;实时混音算法使用每一路音频的短时能量作为混音权重.测试表明,静音检测算法在不同信噪比下语音识别正确率高于G.729B静音检测算法;实时混音算法听觉测试优于传统的算法,并且混音计算延时低,满足网络实时传输的要求;两种算法同时应用于视频会议系统,视频会议服务器的运算量低于使用了G.729B静音检测算法的视频系统.
- 薛卫都思丹叶迎宪方承志
- 关键词:静音检测支持向量机
- 视频压缩新技术及表格数据压缩的研究
- 数据压缩技术在现代信息处理中有着非常重要的作用,一直是学者们研究的一个热点。本文尝试改进三类数据的压缩:视频的无损压缩、视频关键帧的压缩以及包含定长记录的表格数据的压缩。
视频的无损压缩是研究得相对比较少的问题。本...
- 叶迎宪
- 关键词:H.264标准帧内编码
- 针对虹膜图像捕捉的时频域多阶段自动对焦方法
- 本发明公开了一种结合频域和时域的多阶段虹膜图像自动对焦方法。方法的核心在于图像的清晰度评价。通过图像清晰度评价函数判断焦点位置,驱动执行结构调整光学系统的焦点,形成一个自动对焦的闭环控制系统。自动对焦过程分为两个阶段:在...
- 都思丹李杨李华王荣昌罗浩薛卫叶迎宪赵康僆朱欢欢严惠琼刘红星
- 文献传递
- 基于语音特征判别的静音检测方法
- 本发明公开了一种基于语音特征识别的静音检测方法,首先提取一帧音频数据的多门限过零率;用加权多门限过零率对静音进行预判,判别出明显的静音;提取一帧音频数据的复合特征,复合特征包括过零率、短时能量值、基于变分辨率频谱的Mel...
- 都思丹薛卫周余孔令红叶迎宪赵康涟
- 文献传递