张同亮
- 作品数:6 被引量:10H指数:2
- 供职机构:东华大学信息科学与技术学院更多>>
- 发文基金:国家自然科学基金国家教育部博士点基金教育部“新世纪优秀人才支持计划”更多>>
- 相关领域:生物学医药卫生更多>>
- 基于智能计算的蛋白质功能预测研究
- 蛋白质是生命体赖以生存的营养要素,是细胞组织的重要组成部分。几乎所有的生物过程都与蛋白质发生某种联系。根据蛋白质序列的排列顺序和序列信息确定蛋白质的功能成为生物学研究重点。目前蛋白质序列数量的激增,急需要开发快速、准确地...
- 张同亮
- 关键词:蛋白质功能预测亚细胞定位模糊支持向量机
- 文献传递网络资源链接
- 基于伪氨基酸组成的G蛋白偶联受体超家族的识别被引量:4
- 2010年
- G蛋白偶联受体(GPCRs)是人体内最大的蛋白质受体家族,在制药业中起到很大作用。G蛋白偶联受体的功能和其超家族、子家族的分类密切相关,然而目前其空间结构却很难用实验方法获得。因此,如何用计算的方法预测G蛋白偶联受体的家族和超家族是生物信息学和蛋白质科学中重要的研究内容。根据Chou提出的伪氨基酸离散模型框架,使用近似熵的概念表示G蛋白序列附加特征,构造一种新的蛋白序列表示方法。采用FKNN(模糊K近邻)分类器作为预测工具,从最新的G蛋白数据抽取全部数据,经过去除同源性处理后,构成低同源性的新测试数据集。Jackknife测试结果验证了此方法的有效性。与之前的研究结果相比,取得了最高的预测精度。结果表明,此方法处理G蛋白偶联受体有很高的实用价值。
- 顾全丁永生张同亮沈懿珍
- 关键词:G蛋白偶联受体近似熵
- 基于二叉树支持向量机的蛋白质结构类预测被引量:1
- 2008年
- 提出了一种基于二叉树支持向量机(BT-SVM)的蛋白质结构类多类预测新方法。采用26维的向量来表示蛋白质序列的特征。BT-SVM多类分类方法能消除SVM在多分类问题中存在的不可分数据问题。采用两个经典数据集作为测试数据,通过自身一致性和n折叠交叉验证方法测试了新方法的性能。预测结果表明新方法具有良好的预测能力,与使用同一数据集的已有结果相比较,新方法的Jackknife结果和目前最好的方法取得的结果相当,可作为蛋白质结构类预测的一个工具。
- 张同亮丁永生
- 关键词:二叉树支持向量机
- 基于近似熵的伪氨基酸组成预测蛋白质亚核定位被引量:1
- 2008年
- 了解真核细胞中细胞核内蛋白质的定位情况对于新发现蛋白质的功能注释具有重要意义。随着蛋白质数据库中蛋白质序列数量的急速增加,采用计算方法来预测蛋白质亚核定位已经成为蛋白质科学领域研究的热点。根据Chou提出的伪氨基酸组成离散模型,提出了一种新的蛋白质亚核定位预测方法。计算蛋白质序列的近似熵作为附加特征构建伪氨基酸组成,表示蛋白质序列特征,AdaBoost分类算法作为预测工具。与已报道的亚核定位预测方法的性能相比,这种方法具有更高的准确率。
- 张同亮丁永生顾全孙登宽
- 关键词:近似熵ADABOOST分类器
- 基于最大熵模型的蛋白质二级结构的预测被引量:2
- 2008年
- 蛋白质二级结构预测是蛋白质功能预测中一个很重要的环节。我们综合考虑了蛋白质序列中对氨基酸二级结构具有影响的因素,采用最大熵模型实现了对蛋白质二级结构的预测。将氨基酸之间的相互作用和氨基酸对于二级结构的倾向性作为特征函数,充分体现了蛋白质序列中氨基酸之间的短程和长程的相互作用的影响。最大熵模型整合了这些多源的信息,形成一个单一的概率模型。与现有的单序列预测方法相比,本文的方法取得了较高的预测准确率,预测结果表明它是一种实用的预测方法。
- 张同亮丁永生
- 关键词:蛋白质二级结构预测最大熵特征函数
- 使用伪氨基酸和集成分类器预测凋谢蛋白亚细胞定位被引量:2
- 2009年
- 预测凋谢蛋白质亚细胞定位是生物信息学和蛋白质科学中重要的研究内容。基于Chou的伪氨基酸组成概念,用近似熵表示蛋白质序列的附加特征,组成新的伪氨基酸组成表示序列特征。将蛋白质序列看作短时间序列,近似熵能够区分不同亚细胞定位中序列的复杂度。结合多个模糊K近邻分类器(基本分类器)的集成分类器作为预测工具。以不同维数的伪氨基酸组成向量,作为每个基本分类器的输入数据。3个常用的数据集用来测试算法的性能,Jackknife测试结果表明新算法有效和实用。有望发展成为亚细胞定位研究的有用工具。
- 魏蓉赵艳君张同亮顾全
- 关键词:近似熵集成分类器