郑晓斌
- 作品数:3 被引量:4H指数:2
- 供职机构:北京大学更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划北京市优秀博士学位论文指导教师科技项目更多>>
- 相关领域:生物学轻工技术与工程更多>>
- 基于翻译起始信号的原核生物基因组结构多层次分析
- 翻译是中心法则的核心环节之一,而翻译起始是翻译过程的主要调控步骤,因此研究翻译起始机制对于理解生命的起源和进化有重要意义。原核生物的翻译起始信号和翻译起始机制紧密联系。本文以对翻译起始信号的研究为核心,在生物信息学上解决...
- 郑晓斌
- 关键词:生物信息学
- 原核基因翻译起始位点预测的新方法(英文)被引量:2
- 2008年
- 翻译起始位点(TIS,即基因5′端)的精确定位是原核生物基因预测的一个关键问题,而基因组GC含量和翻译起始机制的多样性是影响当前TIS预测水平的重要因素.结合基因组结构的复杂信息(包括GC含量、TIS邻近序列及上游调控信号、序列编码潜能、操纵子结构等),发展刻画翻译起始机制的数学统计模型,据此设计TIS预测的新算法MED-StartPlus.并将MED-StartPlus 与同类方法 RBSfinder、GS-Finder、MED-Start、TiCo 和Hon-yaku等进行系统地比较和评价.测试针对两种数据集进行:当前14个已知的TIS被确认的基因数据集,以及300个物种中功能已知的基因数据集.测试结果表明,MED-StartPlus的预测精度在总体上超过同类方法.尤其是对高GC含量基因组以及具有复杂翻译起始机制的基因组,MED-StartPlus具有明显的优势.
- 胡钢清刘永初郑晓斌杨一帆余振苏朱怀球
- 关键词:原核生物基因预测
- 基于迭代自学习的操纵子结构预测被引量:2
- 2011年
- 原核生物操纵子结构的准确注释对基因功能和基因调控网络的研究具有重要意义,通过生物信息学方法计算预测是当前基因组操纵子结构注释的最主要来源.当前的预测算法大都需要实验确认的操纵子作为训练集,但实验确认的操纵子数据的缺乏一直成为发展算法的瓶颈.基于对操纵子结构的认识,从基因间距离、转录翻译相关的调控信号以及COG功能注释等特征出发,建立了描述操纵子复杂结构的概率模型,并提出了不依赖于特定物种操纵子数据作为训练集的迭代自学习算法.通过对实验验证的操纵子数据集的测试比较,结果表明算法对于预测操纵子结构非常有效.在不依赖于任何已知操纵子信息的情况下,算法在总体预测水平上超过了目前最好的操纵子预测方法,而且这种自学习的预测算法要优于依赖特定物种进行训练的算法.这些特点使得该算法能够适用于新测序的物种,有别于当前常用的操纵子预测方法.对细菌和古细菌的基因组进行大规模比较分析,进一步提高了对基因组操纵子结构的普遍特征和物种特异性的认识.
- 吴文琪郑晓斌刘永初汤凯朱怀球
- 关键词:基因组分析操纵子