您的位置: 专家智库 > >

叶迎宪

作品数:11 被引量:12H指数:2
供职机构:南京大学电子科学与工程学院更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术电子电信更多>>

文献类型

  • 5篇期刊文章
  • 5篇专利
  • 1篇学位论文

领域

  • 6篇自动化与计算...
  • 2篇电子电信

主题

  • 6篇静音
  • 6篇静音检测
  • 4篇向量
  • 4篇向量机
  • 3篇语音
  • 3篇语音特征
  • 3篇支持向量
  • 3篇支持向量机
  • 3篇谱系数
  • 2篇语音聊天
  • 2篇帧内编码
  • 2篇图像
  • 2篇自适
  • 2篇自适应
  • 2篇自适应权重
  • 2篇网络语音
  • 2篇小波
  • 2篇分辨率
  • 2篇变分
  • 2篇变分辨率

机构

  • 11篇南京大学
  • 2篇南京农业大学

作者

  • 11篇叶迎宪
  • 10篇都思丹
  • 8篇薛卫
  • 3篇刘红星
  • 3篇周余
  • 2篇赵康涟
  • 2篇孔令红
  • 1篇李杨
  • 1篇罗浩
  • 1篇严惠琼
  • 1篇王荣昌
  • 1篇方承志
  • 1篇高敦堂
  • 1篇赵康僆
  • 1篇李华
  • 1篇袁杰
  • 1篇朱欢欢

传媒

  • 2篇计算机应用
  • 1篇中国科学技术...
  • 1篇计算机工程
  • 1篇计算机科学

年份

  • 3篇2009
  • 2篇2008
  • 1篇2007
  • 5篇2006
11 条 记 录,以下是 1-10
排序方式:
基于小波变分辨率频谱特征的静音检测被引量:2
2009年
针对静音检测提出基于小波变分辨率频谱特征的检测算法。算法采用多门限过零率对静音进行初判,并提取多个语音感觉特征与基于小波变分辨率频谱的Mel频率倒谱系数(MFCC)组合成语音特征,通过二分类支持向量机对该特征进行分类实现静音检测。测试结果表明,该算法在不同信噪比下语音识别正确率高于G.729b,MFCC特征静音检测算法,基于该算法的视频会议服务器运算量低于使用G.729b静音检测算法的视频系统。
薛卫都思丹叶迎宪
关键词:静音检测小波支持向量机
基于语音特征判别的静音检测方法
本发明公开了一种基于语音特征识别的静音检测方法,首先提取一帧音频数据的多门限过零率;用加权多门限过零率对静音进行预判,判别出明显的静音;提取一帧音频数据的复合特征,复合特征包括过零率、短时能量值、基于变分辨率频谱的Mel...
都思丹薛卫周余孔令红叶迎宪赵康涟
文献传递
支持大容量混音的同声传译视频会议系统及方法
本发明公开了一种支持大容量混音的同声传译视频会议系统及方法,提出了基于Mel尺度倒谱特征与支持向量机静音检测方法、大容量混音方法和同声传译方法。可以实现更高的静音检测率、比其它混音方法更多的混音路数和在同一会议室进行多语...
都思丹薛卫周余叶迎宪刘红星
文献传递
基于线性插值填充的帧内运动补偿被引量:2
2008年
帧内运动补偿被认为是H.264/AVC中具有潜力的改进方向之一。提出了一种线性插值填充算法来改进帧内运动补偿的编码效率。与Dong等人提出的自适应填充算法相比,线性插值填充能更精确地预测出填充区域内的像素,从而使得帧内运动补偿效率更高。实验测试表明,基于线性插值填充的改进算法可以使帧内运动补偿块数量增加4.58%~84.7%,从而令帧内编码的率失真性能得到提高。
叶迎宪都思丹
关键词:H.264/AVC帧内编码线性插值
一种基于H.264与近邻预测的无损视频压缩H.264-LS被引量:3
2006年
提出了一种无损视频压缩方案H.264-LS。该方案为适应无损压缩的需要,根据运动补偿后残差系数的特点,使用了一种二维近邻预测技术以取代H.264原有的变换。实验测试结果表明,该算法的整体表现要优于现有的一些无损视频压缩方案,特别是对于运动量大的视频序列优越性很突出。
叶迎宪都思丹
关键词:H.264
一种基于3D-DCT及帧内预测的静态彩色图像压缩方法JPC3D
一种基于3D-DCT及帧内预测的静态彩色图像压缩方法-JPC3D。所属的技术领域:数字图像处理之编码技术解决的技术问题:降低静态图像压缩的复杂度,同时保持画面细节纹理,达到由于JPEG2000的效果解决该问题的技术方案的...
都思丹叶迎宪薛卫袁杰高敦堂刘红星
文献传递
基于变分辨率频谱特征的向量机静音检测和实时混音技术被引量:3
2006年
静音检测算法基于两个语音感觉特征与变分辨率频谱的Mel频率倒谱系数组合成音频特征,采用多门限过零率对静音进行初判,并通过二分类支持向量机对组合语音特征进行分类;实时混音算法使用每一路音频的短时能量作为混音权重.测试表明,静音检测算法在不同信噪比下语音识别正确率高于G.729B静音检测算法;实时混音算法听觉测试优于传统的算法,并且混音计算延时低,满足网络实时传输的要求;两种算法同时应用于视频会议系统,视频会议服务器的运算量低于使用了G.729B静音检测算法的视频系统.
薛卫都思丹叶迎宪方承志
关键词:静音检测支持向量机
视频压缩新技术及表格数据压缩的研究
数据压缩技术在现代信息处理中有着非常重要的作用,一直是学者们研究的一个热点。本文尝试改进三类数据的压缩:视频的无损压缩、视频关键帧的压缩以及包含定长记录的表格数据的压缩。   视频的无损压缩是研究得相对比较少的问题。本...
叶迎宪
关键词:H.264标准帧内编码
针对虹膜图像捕捉的时频域多阶段自动对焦方法
本发明公开了一种结合频域和时域的多阶段虹膜图像自动对焦方法。方法的核心在于图像的清晰度评价。通过图像清晰度评价函数判断焦点位置,驱动执行结构调整光学系统的焦点,形成一个自动对焦的闭环控制系统。自动对焦过程分为两个阶段:在...
都思丹李杨李华王荣昌罗浩薛卫叶迎宪赵康僆朱欢欢严惠琼刘红星
文献传递
基于语音特征判别的静音检测方法
本发明公开了一种基于语音特征识别的静音检测方法,首先提取一帧音频数据的多门限过零率;用加权多门限过零率对静音进行预判,判别出明显的静音;提取一帧音频数据的复合特征,复合特征包括过零率、短时能量值、基于变分辨率频谱的Mel...
都思丹薛卫周余孔令红叶迎宪赵康涟
文献传递
共2页<12>
聚类工具0