吴松锋
- 作品数:24 被引量:416H指数:9
- 供职机构:北京蛋白质组研究中心更多>>
- 发文基金:国家高技术研究发展计划国家重点基础研究发展计划北京市科技计划项目更多>>
- 相关领域:生物学医药卫生自动化与计算机技术更多>>
- 基于PC/Linux的核酸序列分析系统的构建及其应用被引量:21
- 2001年
- 基于PC机和Linux操作系统 ,利用Phred/Phrap/Consed软件和Blast软件 ,构建了核酸序列大规模自动分析系统 .该套系统可自动完成从测序峰图向核酸序列的转化、载体序列去除、序列自动拼接、重复序列鉴定以及序列的相似性分析 ,可加速对大规模测序数据的分析和利用 .
- 张成岗欧阳曙光张绍文瞿祥虎鱼咏涛周钢桥吴松锋贺福初
- 关键词:PC机LINUX操作系统生物信息学大规模测序核酸序列
- 转录组与蛋白质组比较研究进展被引量:19
- 2005年
- 转录组和蛋白质组比较研究发现,总体而言其间的相关性不高. 根据数据的类型不同可以将现有的研究分为4类:单点比较、两点差异比较、多点时序比较和多点非时序比较. 对其差异原因的研究和分析表明:除了由实验系统及数据类型不同导致的差异外,转录后蛋白质合成各步骤所受到的限制,以及在此过程中的分子调控也对其有重要的影响;而且不同基因,不同组织和细胞在不同状态下可能也会有差异. 因此,结合转录组和蛋白质组的表达谱研究倾向于利用蛋白质组和转录组研究的差异和互补性,同时对生物体特定状态下的基因和蛋白质表达水平进行全方位度量,以获得表达谱的全景图,并挖掘受到转录后调控的基因.
- 吴松锋朱云平贺福初
- 关键词:转录组蛋白质组翻译调控密码子偏性
- 蛋白质组学中新蛋白质鉴定的研究方法和策略被引量:7
- 2007年
- 当前,基于生物质谱进行蛋白质鉴定的技术已经成为蛋白质组学研究的支撑技术之一.产生的数据主要使用数据库搜索的方法进行处理,这种方法的一大缺陷是不能鉴定数据库中未包含的蛋白质,因此如何充分利用质谱数据对蛋白质组研究的意义很大,而新蛋白质鉴定更是其中一个重要的内容.新蛋白质鉴定是蛋白质鉴定的一个方面,新蛋白质的定义按照序列和功能的已知程度分为3个层次;以蛋白质鉴定的方法为基础,目前新蛋白质鉴定的方法可分为denovo测序和相似序列搜索结合的方法以及搜索EST、基因组等核酸数据库的方法2大类;两者各有利弊.存在各自的问题和相应处理的策略.不同的研究者可以根据具体目的应用和发展不同的鉴定方法,同时新蛋白质的鉴定也将随着蛋白质组学研究的发展而更加完善.
- 马洁吴松锋朱云平
- 关键词:蛋白质组学数据库搜索
- 22周孕龄胎肝蛋白质相互作用网络的构建
- 目的:建立在胎肝中存在的蛋白质相互作用的网络以及其中与造血的相互作用和通路。方法:利用多个蛋白质数据库以及邻域基因法、基因融合法、种系发生谱法等三种生物信息学方法,相互补充,相互验证。结果:从数据库中得到508个胎肝蛋白...
- 程钢吴松锋陈廷贵万平朱云平贺福初
- 文献传递
- 一种可用于评估肽质量指纹谱数据的方法--反转错位数据库被引量:1
- 2008年
- 反转数据库常被用于估算大规模蛋白质组研究中串联质谱搜索数据库结果的可靠性。然而,对于经典的且现在依然在产出的肽质量指纹谱的数据,这种方法并不适用。为解决该问题,构建了另外一种随机数据库,称为反转错位数据库。这种数据库是在反转数据库的基础上,将序列中的K和R及其后的氨基酸交换位置(对于胰蛋白酶切割的结果)获得。这种处理避免了某些肽段因前后胰蛋白酶酶切位点氨基酸相同而在序列反转后质量依然不变,导致肽质量指纹谱法无法区分的问题。通过串联质谱和肽质量指纹谱测试数据的搜索结果,证明了这种方法同时适用于串联质谱和肽质量指纹谱的数据。这种方法扩大了经典反转数据库的适用范围,将对评估和整合串联质谱和肽质量指纹谱的数据具有重要意义。
- 吴松锋薛晓芳张纪阳应万涛马洁钱小红朱云平贺福初
- 关键词:蛋白质组肽质量指纹谱
- 蛋白质组学研究中的无标记定量方法被引量:10
- 2006年
- 蛋白质定量是探索疾病发生发展状况和寻找新药靶标的重要手段.该领域最常用的技术是比较染色后的二维凝胶上蛋白点的光密度值或综合同位素标记后的质谱峰强度方法.但此二者的样品处理方法都比较麻烦,不利于进行大规模蛋白质组的定量研究.最近几年出现了利用质谱数据进行无标记定量的方法,根据数据类型这些方法可以分为2类基于鉴定蛋白的肽段数的方法和基于质谱峰强度的方法,在高通量大规模蛋白组定量研究中有很大优势.本综述主要介绍了这2类无标记定量方法的模型及优缺点,并比较了2类方法的灵敏度和准确度.肽段计数方法在检测蛋白丰度变化时更灵敏,而峰面积强度在评估蛋白比率时更准确.
- 薛晓芳吴松锋朱云平贺福初
- 基于质谱技术筛选差异表达蛋白的统计学策略研究进展
- 2015年
- 随着质谱技术的快速发展,蛋白质组学已成为继基因组学、转录组学之后的又一研究热点,寻找可靠的差异表达蛋白对于生物标记物的发现至关重要.因此,如何准确、灵敏地筛选出差异蛋白已成为基于质谱的定量蛋白质组学的主要研究内容之一.目前,针对该问题的研究方法众多,但这些方法策略的适用范围不尽相同.总体来说,基于质谱技术筛选差异蛋白的统计学策略可以分为3类:基于经典统计学派的策略、基于贝叶斯学派的统计检验策略和其他策略,这3类方法有各自的应用范围、特点及不足.此外,筛选过程还将产生部分假阳性结果,可以采用其他方法对差异表达蛋白的质量进行控制,以提高统计检验结果的可靠性.
- 王锦霞常乘马洁吴松锋庄举娟朱云平
- 关键词:质谱蛋白质组学差异表达蛋白
- 一种肝癌细胞凋亡诱导因子及其编码基因与应用
- 本发明公开了一种肝癌细胞凋亡诱导因子及其编码基因与应用。本发明所提供的肝癌细胞凋亡诱导因子,是具有序列表中SEQ ID №:2氨基酸残基序列的蛋白质,或者是将SEQ ID №:2的氨基酸残基序列经过一个或几个氨基酸残基的...
- 贺福初李璐孙立波张令强鱼咏涛邢桂春吴松锋
- 文献传递
- nr数据库分析及其本地化被引量:104
- 2006年
- 通过用NCBI的blastp程序对nr数据库与IPI数据库中属于人类的蛋白质序列进行比较,论证了nr数据库整合到蛋白质注释系统中的必要性。并在此基础上,设计方案实现了nr数据库的本地化,对nr数据库的记录进行了统计分析,提供了数据库的内部访问,为蛋白质注释系统整合nr数据库做好了第一步工作。
- 邓泱泱荔建琦吴松锋朱云平陈耀文贺福初
- 关键词:本地化
- 22周孕龄人胎肝表达序列标签数据更新与初步分析
- 2008年
- 随着国际上转录组数据及本室22周孕龄人胎肝表达序列标签数据的不断增加,先前该组织表达谱的研究有必要进行更新与完善.本研究首先将22周孕龄人胎肝每一表达序列标签与自身数据库,UniGene,DoTS,MGC以及Twinscan预测的人类转录组数据库进行比对以归类.然后,经过电子拼接和基因鉴定,对已知基因进行GO(gene ontology)分类,对未知基因进行Pfam和ScanProsite功能预测.最后,对人胎肝、成人肝、骨髓、胸腺及淋巴结这些拥有造血作用或可表明人胎肝特性的5种组织进行了层次聚类分析.结果表明:(ⅰ)与5种最新人类转录组数据库比对,极大地降低了那些属于一个基因但互不交叠的序列被划分到不同簇的可能性,因此在进行EST归类时,推荐与互联网上有关最新数据进行比对;(ⅱ)一些先前未知EST已被鉴定为已知基因,1379个EST被鉴定为本室独有的全新序列;(ⅲ)通过GO分类,对22周孕龄人胎肝有了一个大致了解,同时获得了6个细胞迁移基因和6个造血相关基因;(ⅳ)通过基因功能预测获得了277个模体(profile),其中有5个类型可分布于10个以上基因之中;(ⅴ)层次聚类表明,5种组织关系与它们的功能相一致;(ⅵ)建立了世界上最大的22周孕龄人胎肝表达序列标签数据库.总之,22周孕龄人胎肝表达序列标签数据的更新与初步分析将有助于对人胎肝造血机制及细胞迁移机制的了解,可促进未来对该组织进行全面深入的研究。
- 陈廷贵吴松锋周钢桥朱云平贺福初
- 关键词:人胎肝表达序列标签基因本体论层次聚类