国家自然科学基金(10471141) 作品数:5 被引量:8 H指数:2 相关作者: 章祥荪 吴凌云 张继红 王勇 王瑞省 更多>> 相关机构: 中国科学院数学与系统科学研究院 北京物资学院 清华大学 更多>> 发文基金: 国家自然科学基金 中国博士后科学基金 更多>> 相关领域: 理学 生物学 更多>>
A Dynamic Programming Algorithm for the κ-Haplotyping Problem 被引量:3 2006年 Zhen-ping Li Ling-yun Wu Yu-ying Zhao Xiang-sun Zhang关键词:整数规划 动态规划 SNP MFR 改进的自组织映射(SOM)蛋白质折叠算法和计算实现 2005年 蛋白质结构预测是生物信息学中的重要研究方向.为了研究蛋白质折叠的机理,人们引入了只考虑蛋白质疏水核心和亲水外围位置导致能量差别的简化HP模型.即使是求解二维HP模型已被证明是一个NP完全问题,因此需要设计有效的近似算法来求解较大规模的HP模型.从旅行商问题(TSP)的求解看,自组织映射是构造近似算法的有效工具.本文将归一化的F-W自组织模型应用到蛋白质二维HP问题的求解中,结合为克服多重映射构造的局部线搜索算法.数值试验表明,该算法改进了现有的HP模型的SOM求解算法, 只需很少的迭代步数就能找到最低能量构象.这一改进算法可以成为进一步研究的基础. 王勇 詹钟炜 吴凌云 章祥荪关键词:自组织映射 搜索算法 单体型装配问题及其算法(英文) 被引量:4 2004年 单核苷酸多态性(SNP)单体型装配问题就是从给定的来自某人染色体的SNP片段中去除错误,重构出尽可能与原来片段一致的单体型.这个问题有几个不同的模型最少片段去除(MFR)问题,最少SNP去除(MSR)问题以及最少错误纠正(MEC)问题.前两个问题的复杂性与算法已有一些学者研究过.第三个问题已被证明是NP完全问题,但这个问题的实际算法还没有.该文对MEC问题给出了一个分支定界算法,这个算法能得到问题的全局最优解.通过这个算法对实际数据的计算说明了MEC模型的合理性,即在一定条件下,通过修正最少的错误重构出的单体型确实是真实的单体型.由于分支定界算法对这样一个NP完全问题不能在可接受的时间内解规模较大的问题,文中又给出了求解MEC问题的两个基于动态聚类的算法,以便对规模较大的问题在可接受的时间内得到近似最优解.数值实际表明这两个算法很快,很有效.这两个算法总能得到与分支定界找到的全局最优解很接近的近似最优解.鉴于MEC问题是NP完全的,这两个算法是有效的、实际的算法. 王瑞省 吴凌云 张继红 章祥荪关键词:动态聚类 SNP 单体型推断问题与配对图(英文) 被引量:2 2004年 纯节俭型单体型推断(PPHI)问题是这样一类单体型推断问题给定n个基因型向量,要求寻找n对单体型,使得每一个基因型刚好由其中一对单体型组合生成,并且这2n个单体型中所含的不同单体型数目最小.u-限制单体型推断(u-PPHI)问题是一类特殊的纯节俭型单体型推断问题,要求每一个单体型至多可以用于分解u个基因型.PPHI和u-PPHI问题都是NP-困难的.文中首先介绍了配对图的概念,并通过配对图将两类问题转化为图论问题;然后分别给出了两类问题的近似算法;最后,专门讨论了当u=2时的2-PPHI问题,并在配对图上给出了相应的算法. 李珍萍 王勇 赵玉英 章祥荪关键词:单体型 基因型 SNP 允许长度估计误差的SBH最优重构问题及其算法 被引量:1 2005年 本文讨论了允许长度估计误差和杂交错误的更实际SBH(Sequencing by Hybridization)最优重构问题.通过对SBH谱集中k-tuple之间的相关信息的分析和最优重构性质的讨论,我们得到若干非最优解的删除法则和最优解的判定法则,并获得了一个能够极大地减少最优解重构随意性的动态规划计算方法.由此,我们给出了该SBH问题的一个新重构算法.该算法既允许SBH谱集含有一般杂交实验中可能出现的探针错配所产生的正错误,也允许目标DNA序列长度有估计误差,所以本文的算法具有更一般的适应性和实用性.模拟计算结果表明我们的算法也是十分有效的(即使在谱集有多达100%的正错误情况). 张继红 吴凌云 章祥荪关键词:最优解 动态规划