王雅男
- 作品数:2 被引量:0H指数:0
- 供职机构:大连交通大学理学院更多>>
- 相关领域:生物学更多>>
- 全β类蛋白编码序列的LZ复杂度对蛋白质折叠速率的影响
- 2016年
- 蛋白质折叠速率预测问题是计算生物学和生物信息学中的核心问题之一.科研工作者相继提出了许多参数和方法来探索折叠速率的决定因素.但蛋白质编码序列复杂度信息对蛋白质折叠速率的影响未被提及.提取编码序列LZ复杂度信息,融合多特征信息,建立线性回归模型进行折叠速率预测.该方法能在不需要结构信息的情况下,直接从蛋白质的编码序列出发对全β类蛋白质进行折叠速率进行预测.在卡方检验方法的验证下,发现折叠速率的预测值与实验值有很好的相关性,相关系数能达到0.9712.这一精度明显优于其他基于序列的方法,充分说明序列LZ复杂度是一个有效特征信息,蛋白质编码序列LZ复杂度信息确实影响蛋白质折叠速率及其结构.
- 白凤兰王华王雅男单婷
- 关键词:蛋白质折叠相关系数
- 基于序列特征组合与核非线性回归预测蛋白质折叠速率
- 2017年
- 选取可压缩性、LZ复杂度等特征值,将它们和20种氨基酸属性C_a,K^0,P_β,R_a,ΔASA,PI,H_t,M_μ,Esm进行组合,表征蛋白质序列.建立多元核非线性回归模型,用核非线性回归模型计算了83个蛋白质的折叠速率预测值.由Jack-knife检验方法得知在不同的结构中不同组合特征值与相应折叠速率有较好的相关性.实验结果表明:多元核非线性回归模型其预测精度及可行性高于线性回归模型,计算复杂度低和方便易操作等优点,具有良好的应用前景.
- 王雅男白凤兰刘立伟王华
- 关键词:蛋白质序列相关系数