国家自然科学基金(30500105)
- 作品数:4 被引量:21H指数:2
- 相关作者:应晓敏李伍举侯妍妍叶继华应德全更多>>
- 相关机构:军事医学科学院江西师范大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划全球变化研究国家重大科学研究计划更多>>
- 相关领域:生物学自动化与计算机技术医药卫生更多>>
- 人源microRNA前体的全基因组预测
- 2011年
- microRNA(miRNA)是一类不编码蛋白的调控小分子RNA,在真核生物中发挥着广泛而重要的调控功能.由于miRNA的表达具有时空特异性,因而通过计算方法预测miRNA而后有针对性的实验验证是miRNA发现的一条重要途径.降低假阳性率是miRNA预测方法面临的重要挑战.本研究采用集成学习方法构建预测miRNA前体的分类器SVMbagging,对训练集、测试集和独立测试集的结果表明,本研究的方法性能稳健、假阳性率低,具有很好的泛化能力,尤其是当阈值取0.9时,特异性高达99.90%,敏感性在26%以上,适合于全基因组预测.采用SVMbagging在人全基因组中预测miRNA前体,当取阈值0.9时,得到14933个可能的miRNA前体.通过与高通量小RNA测序数据的比较,发现其中4481个miRNA前体具有完全匹配的小RNA序列,与理论估计的真阳性数值非常接近.最后,对32个可能的miRNA进行实验验证,确定其中2条为真实的miRNA.
- 应晓敏朱娟娟王小磊赵东升付汉江郑晓飞李伍举
- 关键词:MIRNA
- sRNASVM——基于SVM方法构建大肠杆菌sRNA预测模型(英文)被引量:1
- 2009年
- 在理解细菌与环境的相互作用方面,细菌sRNA的识别发挥重要作用。文章介绍了一个通过增加训练集中实验证实的sRNA来构建细菌sRNA预测模型的策略,并以大肠杆菌K-12的sRNA预测为例来说明策略的可行性。结果表明,按此策略构建的模型sRNASVM的10倍交叉检验精度达到92.45%,高于目前文献中报道的精度。因此,构建的这一模型将为实验发现sRNA提供较好的生物信息学支持。有关模型和详细结果可以从网站http://ccb.bmi.ac.cn/srnasvm/下载。
- 王立贵应晓敏曹源查磊李伍举
- 关键词:SRNA
- microRNA计算发现方法的研究进展被引量:16
- 2008年
- microRNA(miRNA)是近几年发现的一类长度为~21nt的内源非编码小RNA,在植物和动物中发挥着重要而广泛的调控功能。它的发现主要有cDNA克隆测序和计算发现两条途径。由于cDNA克隆测序方法受miRNA表达的时间和组织特异性以及表达水平的影响,而计算发现可以弥补其不足,因此miRNA的计算发现方法研究受到了广泛的重视。文章对近几年计算发现miRNA的研究进展进行了综述,根据计算发现方法的本质,将计算发现方法归纳为5类,分别是同源片段搜索方法、基于比较基因组学的预测方法、基于序列和结构特征打分的预测方法、结合作用靶标的预测方法和基于机器学习的预测方法,并对各类方法的原理、核心思想、优点和局限性进行了分析,最后探讨了进一步的发展方向。
- 侯妍妍应晓敏李伍举
- 关键词:MICRORNA比较基因组学
- 一种基于图论的聚类算法NeiMu被引量:4
- 2009年
- 提出一种新的基于图论的聚类算法NeiMu。该算法首先分析数据中的对象,寻找每个对象的k近邻,根据k近邻关系构造k近邻有向图,然后通过k近邻有向图中的k-互邻居关系构造k-聚类图,发现数据中的自然聚类。算法的特点是根据数据之间的互为k近邻关系确定数据中的自然簇,而不必引入其他方法来划分小簇,从而能够保证对象不会被错误聚类,仅会与其他小簇一起融合到一个大簇中。这一优点可以有效保证NeiMu算法的聚类质量。而且,NeiMu算法给出的这种类似自底向上的层次聚类结果还有利于用户根据渐变的结果确定最佳的k值。实验结果表明,该算法对密度变化大的数据、大小相差大的数据、任意分布形状的数据均具有很好的聚类质量,对孤立点也很健壮。
- 应德全应晓敏叶继华
- 关键词:图论聚类K近邻