广东省自然科学基金(000872)
- 作品数:31 被引量:168H指数:6
- 相关作者:张有为甘俊英江太辉邱政权蒙山更多>>
- 相关机构:五邑大学北京航空航天大学华南理工大学更多>>
- 发文基金:广东省自然科学基金江门市科技攻关项目更多>>
- 相关领域:电子电信自动化与计算机技术交通运输工程机械工程更多>>
- 基于CORBA的分布式智能交互结构模型
- 本文介绍了我们正在进行的关于人机自然交互(Human-Machine Natural Interaction-HMNI)系统的基础计算环境的研究工作。在人机自然交互系统这一类多模态信息处理系统中,各模态信号以及大量相关数...
- 蒙山张有为
- 关键词:智能交互分布式对象计算
- 文献传递
- 人机交互中视觉语言的灰度轮廓权向量差分唇形特征模型被引量:6
- 2002年
- 该文结合函数变形模型和灰度轮廓向量模型的特点,给出了一种维数少、有效性高的视觉语言特征—灰度轮廓权向量差分唇形特征模型。该特征融合了嘴唇图像的形状变化信息和灰度信息,能够较完善地描述嘴唇的变化。同时,得出了一种新的视觉特征提取算法。仿真结果表明,该算法与传统的函数变形模型相比,总的特征提取准确率提高了5个百分点,每个发音图像序列特征提取的准确率提高了1.6至9个百分点,每帧图像的特征提取时间由4.6495秒下降到0.4455秒。对“1”至“10”数字发音的嘴唇图像序列进行识别,获得了较高的识别率。因此,灰度轮廓权向量差分唇形特征是一种精炼、描述性强、适合于唇读识别的视觉语言特征,该算法能自动地完成模型的训练和视觉特征的提取,是一种有效的特征提取算法。
- 甘俊英赵向阳张有为
- 关键词:人机交互视觉语言语音识别图像识别
- 用于人脸识别的人脸图像标准化算法被引量:17
- 2002年
- 人脸图像的标准化,作为人脸图像预处理过程,是计算机人脸识别中很重要的一个环节. 论文给出了一种改进的人脸图像标准化算法. 该算法首先利用人脸图像的垂直灰度投影曲线确定脸的左右边界;接着根据人脸图像的水平灰度投影曲线来确定眼、嘴的位置;然后依据确定的眼、嘴以及脸的左右边界这些参数对图像进行剪裁和缩放;最后获得人脸的标准图像. 采用ORL人脸数据库进行仿真实验,结果表明,该算法基本消除了背景、头发、服装等干扰,保留了人脸识别所需的主要信息,更利于后续的特征提取与识别,解决了常规方法不适合侧面人脸图像或者闭上双眼的人脸图像的问题,是一种有效的方法.
- 甘俊英黄宇明
- 关键词:人脸识别模式识别图像处理
- 一种改进的语音基频轮廓提取算法被引量:3
- 2002年
- 在说话人识别课题中,需要提取精确的基频轮廓作为特征参量,但通常使用传统的固定窗口长度的短时自相关函数算法并不能够适应各种不同人的发音. 论文使用了一种可变窗口长度的改进算法,实验表明它有更强的适应能力. 文中还介绍了一种改进的基频“野点”平滑算法,它能够在去除野点的同时,更好地保存正确点的信息.
- 江太辉
- 关键词:语音信号处理平滑滤波语音识别说话人识别
- 用K-D树实现对双模态多媒体数据库的有效查询被引量:1
- 2003年
- 论文提出了一种用k-d树来查询双模态视觉听觉语音识别数据库的方法。这种方法揉合了查询地理信息系统的多维数据库和空间数据库的方法,结合双模态视觉听觉语音数据库自身的特点提出了在数据库中插入、查询和删除记录的算法。最后还对把查询多维数据的方法应用在双模态语音识别数据库领域进行了展望。
- 何元烈应自炉张有为
- 关键词:多媒体数据库数据库查询
- 模式识别中广义核函数Fisher最佳鉴别被引量:26
- 2002年
- 本文在线性Fisher鉴别与核函数Fisher鉴别的基础上,依据D.H.Foley和J.W.Sammon提出的广义Fisher最佳鉴别概念,将两类模式识别问题的求解方法进行非线性推广,引入了相应的概念,导出并证明了广义核函数Fisher最佳鉴别,得出了广义核函数Fisher最佳鉴别的决策函数.广义核函数Fisher最佳鉴别在判断测试样本时采用竞争原则,将测试样本判为具有最大决策函数值所属的类别,为解决多类模式识别问题提供了一种有效途径.广义核函数Fisher最佳鉴别具有充分的理论依据,泛化能力强,在多类模式识别中具有重要的意义和应用价值.
- 甘俊英张有为
- 关键词:模式识别核函数
- 语音识别电话系统中的VSELP声码器的设计与实现被引量:1
- 2003年
- 介绍VSELP声码器的主要特性及在语音识别电话系统中的设计与实现,并说明VSELP算法实时实现的一些关键技术。
- 江太辉
- 关键词:语音识别声码器解码
- 基于双台链罗兰C导航仪的双曲线导航定位算法被引量:7
- 2003年
- 该文提出了一种直接解法与牛顿迭代计算相结合的方法来求解船位。首先用直接解法在球面上求得组合双曲线方程组的一个解,当作船位的概位解,然后应用牛顿迭代法,求解△φ,△λ,当此差值小于某个预先给定的收敛门限ε时,则所求船位为真实解。一般只要选代二、三次就可得到秒级精度的船位解。
- 闵思鹤王甲池江太辉田震华
- 关键词:双曲线导航
- 一种使用计算机提取人脸图像特征的阈值最优分层法被引量:2
- 2002年
- 在人脸识别中,人脸图像对光照环境变化非常敏感,并严重地影响人脸图像的识别率。针对这一问题,提出了一种使用计算机提取人脸图像特征的阈值最优分层法。该方法依据定义的图象空间分割原理,将图像阈值的选取问题转化为阈值的最优化问题,对所设计的目标函数引入加权系数,并利用单纯形法进行寻优,使问题的求解更符合实际。采用ORL人脸数据库进行仿真实验,利用阈值最优分层法将人脸图象空间划分成不相重叠的子图象空间,使每层子图象空间象素数均匀分布。结果表明,该方法具有阈值自适应调节的特性,避免了固定阈值选取对光照环境变化非常敏感的缺点,对人脸图像的识别具有一定的意义。
- 甘俊英张有为
- 关键词:图像分割人脸识别计算机
- 视觉语音识别中的函数变形模板灰度轮廓向量表征法
- 本文提出一种视觉语音识别中的函数变形模板灰度轮廓向量表征法,它是基于传统变形模板和灰度轮廓模型,采用函数变形模板自动求导数和边沿点垂线,自动训练建立了嘴唇灰度轮廓模型.与传统的边沿梯度相比,更好地表征了嘴唇轮廓特征,进而...
- 赵向阳张有为
- 文献传递