国家自然科学基金(60471003)
- 作品数:39 被引量:81H指数:5
- 相关作者:王正志杜耀华倪青山王广云邱浪波更多>>
- 相关机构:国防科学技术大学空军工程大学广州市妇女儿童医疗中心更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:生物学医药卫生自动化与计算机技术航空宇航科学技术更多>>
- 一种基于特征筛选的原核生物启动子判别分析方法被引量:7
- 2006年
- 启动子识别是研究基因转录调控的重要环节,但目前方法的识别正确率偏低。在深入分析原核启动子特征的基础上,提出了一种基于特征筛选的原核启动子判别分析方法,首先在启动子序列的组成特征、信号特征和结构特征中选取备选特征,为每个特征建立适当的描述模型,并对主要的保守模式采用复合模式模型;再通过模型计算对备选特征进行逐步筛选,优化特征集,将序列表示为组合特征向量;最终利用二次判别分析实现识别。对大肠杆菌和枯草杆菌实际启动子数据进行的刀切法测试验证了方法的有效性和通用性。对于大肠杆菌非编码区(70启动子,识别的平均正确率达到了85.8%,优于其它几种典型识别方法;对于大肠杆菌编码区内部)70启动子和其它几种原核启动子,平均正确率也都超过了80%。方法框架还具有良好的可扩展性,能够方便地容纳新特征,使识别性能不断提高。
- 杜耀华王正志倪青山李冬冬
- 关键词:原核生物启动子识别二次判别分析
- 基于支持向量机的人类5'非翻译区剪接位点识别被引量:7
- 2005年
- 基因非编码区域剪接位点的识别是基因识别中一个非常具有挑战性的问题,尤其是5'非翻译区中剪接位点的识别。与一般剪接位点不同,5'非翻译区剪接位点的两侧不存在由编码到非编码的状态转移,所以通常的剪接位点识别算法在非翻译区的性能不太理想。文章采用了基于支持向量机的方法对5'非翻译区中的剪接位点进行识别。为了提高识别精度,采用了基于矩阵相似性度量的核函数参数选取方法,它能够简单快速地确定合适的核函数参数,进而提高核函数的识别性能。通过实验验证,经过参数选择后的支持向量机能够较好地识别5'非翻译区剪接位点。
- 晏春杜耀华高青斌王正志
- 关键词:支持向量机核函数参数选择
- 利用分散量理论辨识外膜蛋白
- 2008年
- 利用分散量的数学理论,提出了基于最小分散增量的蛋白质序列辨识方法.通过多种特征联合对蛋白质序列进行编码,并建立基于最小分散增量的分类器MID_OMP,应用于革兰氏阴性细菌外膜蛋白序列辨识.在数据集上的Jackknife测试中,MID_OMP辨识外膜蛋白和α螺旋跨膜蛋白的准确率达到95.7%,辨识外膜蛋白和球状蛋白的准确率达到91.0%;在14个细菌基因组内挖掘结果显示,MID_OMP具有较高的敏感性和特异性,预测结果的可信度明显优于另外一种OMPs挖掘工具TMBETA-GENOME.
- 邹凌云王正志黄教民
- 关键词:外膜蛋白
- 判据搜索算法及其在DNA序列模式发现中的应用(英文)被引量:2
- 2006年
- 模式发现是计算生物学一个重要的研究方向,但目前的大部分算法还不能保证获得最优的模式。将模式发现问题转化成层次图的路径搜索问题,推导了针对三个序列片段相似性关系的判据,以其作为剪枝规则提出并实现了一种深度优先的穷举搜索算法:判据搜索算法(CriterionSearchAlgorithm,CRISA)。理论分析表明,对于绝大多数模式发现问题,CRISA具有多项式的计算时间复杂度和线性的空间复杂度。对仿真的和实际的DNA序列数据的测试表明,CRISA能够快速而完全地识别出序列中所有的模式,并且获得了优于其它算法的总体评价。
- 杜耀华李冬冬王正志
- 关键词:判据深度优先搜索层次图
- 利用序列保守模体和局部构象信息预测转录因子结合位点被引量:6
- 2006年
- 转录因子结合位点的计算预测是研究基因转录调控的重要环节,但常用的位置特异得分矩阵方法预测特异性偏低.通过深入分析结合位点的生物特征,提出了一种综合利用序列保守模体和局部构象信息的结合位点预测方法,以极大相关得分矩阵作为保守模体的描述模型,并根据二苷参数模型计算位点序列的局部构象,将两类信息得分组合为多维特征向量,在二次判别分析的框架下进行训练和滑动预测.预测过程中还引入了位置信息量以优化似然得分和过滤备选结果.针对大肠杆菌CRP和Fis结合位点数据的留一法测试结果表明,描述模型的改进和多种信息的融合能有效地改善预测方法的性能,大幅度提高特异性.
- 杜耀华倪青山王正志
- 关键词:转录因子结合位点二次判别分析
- 基因表达缺失值的加权回归估计算法被引量:5
- 2007年
- 在基因芯片实验中,数据缺失客观存在,并在一定程度上影响芯片数据后续分析结果的准确性。在不增加实验次数的情况下,缺失值估计是降低缺失数据对后续分析影响的有效方法。利用相似性信息的核加权函数来实现缺失值回归估计的局部化,提出了基于加权回归估计的基因表达缺失值估计算法。在两个不同类型的基因芯片数据上,将新方法与几种已知的方法进行了比较分析。实验结果表明,新的估计算法具有比传统缺失值估计算法更好的稳定性和估计准确度。
- 邱浪波王广云王正志
- 关键词:缺失值
- 基于位置特异性谱和输入加权神经网络的蛋白质亚细胞定位预测(英文)被引量:3
- 2007年
- 蛋白质必须处于正确的亚细胞位置才能行使其功能。文章利用PSI-BLAST工具搜索蛋白质序列,提取位点特异性谱中的位点特异性得分矩阵作为蛋白质的一类特征,并计算4等分序列的氨基酸含量以及1~7阶二肽含量作为另外两类特征,由这三类特征一共得到蛋白质序列的12个特征向量。通过设计一个简单加权函数对各类特征向量加权处理,作为神经网络预测器的输入,并使用Levenberg-Marquardt算法代替传统的EBP算法来调整网络权值和阈值,大大提高了训练速度。对具有4类亚细胞位置和12类亚细胞位置的两种蛋白质数据集分别进行"留一法"测试和5倍交叉验证测试,总体预测精度分别达到88.4%和83.3%。其中,对4类亚细胞位置数据集的预测效果优于普通BP神经网络、隐马尔可夫模型、模糊K邻近等预测方法,对12类亚细胞位置数据集的预测效果优于支持向量机分类方法。最后还对三类特征采取不同加权比例对预测精度的影响进行了讨论,对选择的八种加权比例的预测结果表明,分别给予三类特征合适的权值系数可以进一步提高预测精度。
- 邹凌云王正志黄教民
- 关键词:亚细胞定位加权函数BP神经网络
- 基于物理化学性质优化的蛋白质相互作用预测研究被引量:2
- 2009年
- 蛋白质相互作用预测是生物信息学研究的重要问题之一.提出了一种基于物理化学性质优化的蛋白质相互作用预测方法,与现有方法的显著不同就是,并未使用已知的氨基酸残基的物理化学性质,而是通过粒子群算法优化得到有益于相互作用预测的物理化学性质数值.对真实的数据集测试表明,优化得到的物理化学性质比现有的物理化学性质更有益于提高蛋白质相互作用的预测性能,与其它方法相比,也具有一定的优势,说明该方法是一种有效的蛋白质相互作用预测方法.
- 倪青山王正志赵英杰黎刚果
- 关键词:蛋白质相互作用物理化学性质粒子群优化算法
- 大肠杆菌内源性转录终止子的支持向量机预测方法被引量:1
- 2012年
- 内源性转录终止子的计算预测是基因转录调控研究的重要内容,但当前方法的预测特异性偏低.在深入分析大肠杆菌内源性终止子中RNA发夹结构和多聚胸腺嘧啶区域等特征信号的基础上,为内源性终止子建立了一个由5个特征变量组成的包含序列组分、局部构象和能量分布信息的特征集,并根据此特征集实现了一种基于支持向量机的内源性终止子计算预测方法.针对大肠杆菌内源性终止子数据集和编码区阴性对照集的六重交叉验证测试证实了预测方法的有效性,对已知数据的预测平均正确率达到了99.4%.在对大肠杆菌全基因组限定范围内的搜索中,该预测方法可以成功地识别出绝大多数已知内源性终止子,与其他几种常用方法相比,预测结果总数大幅度减少,预测的特异性有了明显提高.
- 杜耀华王正志吴太虎
- 关键词:转录终止支持向量机
- 一个基于生物视觉的单目运动方向检测模型
- 2008年
- 运动感知是生物视觉脑机制的重要组成部分之一。该文根据形状运动边界轮廓系统(Formotion BCS)模型的相关原理,先通过扩展其暂态网络处理阶段的不对称方向抑制机制和在其竞争网络阶段引入相反方向上的抑制核以及在边界分割阶段引入运动双极细胞的合作机制,结合单目静态边界处理,建立了检测运动方向的单目神经动力学模型;然后根据该模型编写仿真程序用于运动方向检测。仿真结果表明,利用生物视觉原理来实现物体的运动方向检测是一条可行的研究途径。
- 范学刚王正志黄教民