刘永初
- 作品数:4 被引量:4H指数:2
- 供职机构:北京大学更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划北京市优秀博士学位论文指导教师科技项目更多>>
- 相关领域:生物学轻工技术与工程更多>>
- 一种基于翻译调控信号的原核生物基因组比较方法
- 原核生物翻译起始位点(Translation Initiation site,TIS)上游存在调控基因转录和翻译的重要调控信号。本文基于x2统计方法发展了一种定量刻画DNA序列特征的新方法,用以刻画原核生物基因TIS上游...
- 刘永初朱怀球
- 关键词:DNA序列
- 文献传递
- 原核基因翻译起始位点预测的新方法(英文)被引量:2
- 2008年
- 翻译起始位点(TIS,即基因5′端)的精确定位是原核生物基因预测的一个关键问题,而基因组GC含量和翻译起始机制的多样性是影响当前TIS预测水平的重要因素.结合基因组结构的复杂信息(包括GC含量、TIS邻近序列及上游调控信号、序列编码潜能、操纵子结构等),发展刻画翻译起始机制的数学统计模型,据此设计TIS预测的新算法MED-StartPlus.并将MED-StartPlus 与同类方法 RBSfinder、GS-Finder、MED-Start、TiCo 和Hon-yaku等进行系统地比较和评价.测试针对两种数据集进行:当前14个已知的TIS被确认的基因数据集,以及300个物种中功能已知的基因数据集.测试结果表明,MED-StartPlus的预测精度在总体上超过同类方法.尤其是对高GC含量基因组以及具有复杂翻译起始机制的基因组,MED-StartPlus具有明显的优势.
- 胡钢清刘永初郑晓斌杨一帆余振苏朱怀球
- 关键词:原核生物基因预测
- 宏基因组的基因预测算法研究
- 宏基因组学是一门新兴的无需依赖实验室培养过程研究微生物的学科。在新一代测序技术不断发展的推动下,宏基因组学提供了研究环境微生物组的新思路;与此同时,新测序技术产生的高通量序列数据也对计算生物学提出了新的挑战。本文着眼于宏...
- 刘永初
- 关键词:宏基因组基因预测
- 基于迭代自学习的操纵子结构预测被引量:2
- 2011年
- 原核生物操纵子结构的准确注释对基因功能和基因调控网络的研究具有重要意义,通过生物信息学方法计算预测是当前基因组操纵子结构注释的最主要来源.当前的预测算法大都需要实验确认的操纵子作为训练集,但实验确认的操纵子数据的缺乏一直成为发展算法的瓶颈.基于对操纵子结构的认识,从基因间距离、转录翻译相关的调控信号以及COG功能注释等特征出发,建立了描述操纵子复杂结构的概率模型,并提出了不依赖于特定物种操纵子数据作为训练集的迭代自学习算法.通过对实验验证的操纵子数据集的测试比较,结果表明算法对于预测操纵子结构非常有效.在不依赖于任何已知操纵子信息的情况下,算法在总体预测水平上超过了目前最好的操纵子预测方法,而且这种自学习的预测算法要优于依赖特定物种进行训练的算法.这些特点使得该算法能够适用于新测序的物种,有别于当前常用的操纵子预测方法.对细菌和古细菌的基因组进行大规模比较分析,进一步提高了对基因组操纵子结构的普遍特征和物种特异性的认识.
- 吴文琪郑晓斌刘永初汤凯朱怀球
- 关键词:基因组分析操纵子