国家自然科学基金(31160341) 作品数:9 被引量:22 H指数:3 相关作者: 禹龙 田生伟 王梅 李莉 林江丽 更多>> 相关机构: 新疆大学 新疆医科大学 江苏理工学院 更多>> 发文基金: 国家自然科学基金 更多>> 相关领域: 自动化与计算机技术 轻工技术与工程 理学 医药卫生 更多>>
基于深度信念网络的CYP450 2C9抑制性分类 被引量:3 2019年 细胞色素P450 2C9 (Cytochrome P450 2C9)是人体肝脏中重要的代谢酶,参与多种药物代谢,约占CYP450蛋白总量的15%~20%。利用深度学习思想,提出基于深度信念网络DBN (Deep Belief Network)的CYP450 2C9抑制性分类模型。实验选用13 000个化合物作为数据集,采用Pub Chem和MACCS分子指纹进行分子结构表征。利用DBN的半监督学习方式从预处理后的特征中学习更本质的特征表示,避免人工提取特征的过程,实现CYP450 2C9的抑制性分类。实验结果表明:在同等条件下,DBN相比于SVM和ANN具有明显优势,平均分类准确率为80.6%,灵敏度(SE)为86.9%,特异性(SP)为66.2%,对药物筛选和新药研发具有积极意义。 李自臣 史新宇 史新宇 禹龙 田生伟 王梅关键词:CYP450 分子指纹 支持向量机 人工神经网络 基于改进的降噪自编码药物透血脑屏障预测 被引量:2 2018年 药物透血脑屏障是新药研发的一个重要因素。在传统栈式降噪自编码(stacked denoising autoencoder,SDAE)基础上,提出一种改进的SDAE药物透血脑屏障预测方法。利用主成分分析(principal components analysis,PCA)无监督训练一组权值初始化SDAE,避免随机初始化权值造成模型收敛速度较慢的问题;然后为降噪自编码(denoising autoencoder,DAE)增加一层隐藏层,构造双隐层DAE,提高单个DAE提取药物分子抽象特征的能力;融合SDAE最后两个DAE的第一层隐藏层输出作为softmax分类器的输入,最终实现药物透血脑屏障预测。实验表明,与传统的SDAE及浅层机器学习模型SVM相比,改进后的模型对药物透血脑屏障具有更好的预测效果。 周兴发 禹龙 田生伟 李莉 王梅关键词:血脑屏障 SO_2处理对新疆3种葡萄香气成分的影响 被引量:8 2016年 采后SO_2处理对新疆"无核白"、"木纳格"和"红提"3种葡萄果实香气成分的影响。选4-壬醇做内标,采用顶空固相微萃取-气相色谱-质谱联用技术对SO_2处理前3种葡萄成熟果实的香气成分进行定性和定量分析,同时考察了添加焦亚硫酸钠对"无核白"葡萄香气成分的影响及采后不同贮藏时间SO_2处理对3种葡萄果实香气成分的影响。结果表明,3种葡萄中分别鉴定出40、38、37种香气成分,其中C_6醛(即己醛和E-2-己烯醛)在3种葡萄中的含量相对较高;添加焦亚硫酸钠对"无核白"葡萄中的C_6醛含量影响较大,其他成分含量变化不大;采后SO_2处理3种葡萄果实香气成分中的C_6醛的含量均随着贮藏时间的延长而逐渐降低。 林江丽 朱亚娟 王金霞 王吉德关键词:葡萄 香气成分 SO2 HPLC法测定鲜食葡萄采后贮藏过程中糖分的变化 被引量:3 2014年 利用高效液相色谱法测定鲜食葡萄采后贮藏过程中糖分的变化.色谱柱为Inertsil NH2柱,流动相为75%的乙腈水溶液,用示差折光检测器检测不同贮藏期鲜食葡萄果实中的糖分.本方法的相对标准偏差为0.52%~1.22%,相关系数分别为0.997 3和0.999 3,加标回收率为99.81%~100.4%.该方法简便、灵敏、结果可靠,两种糖都得到了较好的分离,适用于鲜食葡萄果实中糖分的分析. 林江丽 朱亚娟 王金霞 封顺 王吉德关键词:HPLC 葡萄 贮藏 糖分 基于深度学习的口服生物利用度分类研究 被引量:2 2016年 针对采用传统方法测量口服生物利用度(OB)代价昂贵、花费周期长,而现有的一些机器学习方法对其预测精度较低的问题,提出了一种基于栈式自编码(SAE)神经网络的口服生物利用度分类方法,利用经筛选过的分子特征结合栈式自编码模型对生物利用度进行分类。实验表明,与浅层机器学习模型支持向量机(SVM)以及人工神经网络(ANN)相比,深度网络对化合物分子的特征有更本质的学习,采用经筛选过的2D和3D分子特征组合对人体口服生物利用度的分类效果较好,其平均预测精度为83%,灵敏度(SE)为94%,特异性(SP)为49%。 史新宇 禹龙 田生伟 叶飞跃 钱进 高双印关键词:口服生物利用度 基于数据预处理深度置信网络的药物与非药物分类(英文) 2018年 制药工业的一个主要趋势是整合传统意义上被认为早期阶段药物发现的分子描述.为了更好的将药物和非药物分类,本文提出了基于深度信念网络(DBN)的分类模型.首先,对分子特征进行预处理以保证有价值的信息得到保留,其次,该模型将DBN和反向传播(BP)分类器结合去对药物/非药物进行检测和分类.DBN由几个受限玻尔兹曼机(RBM)层组成,当特征向量转移到下一层时这些RBM层尽可能多的保留具有重要的影响的信息.BP层训练的最后一个RBM层生成特征分类.结果表明,该方法是提取高层次特征的药物和非药物分类任务中一种成功的方法,分类精度高达85.3%,高于传统的支持向量机和神经网络方法.同时,预处理对分子特征的提取更为有效,从而在一定程度上提高了分类的准确性. 禹龙 牛苗 田生伟 孙霞 李莉 王梅 孔军关键词:数据预处理 特征提取 基于深度学习的抗HIV活性QSAR预测 被引量:2 2017年 为提高抗HIV活性预测的精度,采用深度学习算法,提出一种基于深度信念网络的抗HIV活性预测方法。利用BP神经网络任意精度逼近非线性函数的优点,结合多个受限玻尔兹曼机(restricted Boltzmann machine,RBM)进行非监督逐层贪婪模式训练学习,建立深度信念网络算法模型(deep belief network,DBN)。将抗HIV活性的高温超导源数据(HTS raw data)、高温超导抑制剂(HTS%inhibition(20μM))、最大测定信号释放比率(mean max signal)等特征作为DBN模型的输入,抗HIV平均活性值作为该模型的输出,设计实验对模型进行训练及验证,实验结果表明,DBN模型对抗HIV活性的预测均方根误差小,预测精度高,平均预测精度为93.82%,适用于抗HIV活性评估。 高双印 田生伟 禹龙 史新宇关键词:抗HIV活性 基于一致性Hash的分布式海量分子检索模型 被引量:2 2015年 针对大数据环境下,传统通用图匹配检索低效、折射率数据无法快速定位的问题,建立了基于一致性Hash的分布式海量分子检索模型。模型结合分子特点,将连续的折射率通过等宽算法离散化建立高速Hash索引,实现分布式海量分子检索系统,有效减小了参与计算的分子数据规模,并根据分子访问频次处理冲突从而提高分子检索效率。实验结果表明,在包含20万个分子的数据中,该方法平均检索耗时约为通用图匹配平均检索耗时的5%,模型性能稳定,具有高可扩展性;对于海量数据环境下依据折射率检索高频次分子较为适用。 孙霞 禹龙 田生伟 闫奕霖 林江丽关键词:离散化 分布式计算 基于降噪自编码神经网络的化合物毒性预测方面的研究 2018年 常规毒理学实验方法周期长、耗资高,对现代药物研发和环境化合物安全性评估具有局限性,通过对化合物毒理性研究,提取1 047维分子指纹特征,提出去噪自编码神经网络无监督学习机制及对腐败特征的自联想学习特性提取隐含毒性化合物特征,实现化合物毒性预测和毒性化合物的活性预测。该方法在化合物毒性预测和活性预测中的预测精度分别为79.825%、80.85%,敏感性分别为79.62%、80.25%,特异性分别为80.03%、81.45%。实验结果表明,去噪自编码网络较浅层机器学习更适用于高通量化合物毒性预测,较传统自编码网络更具优越性。 黎红 禹龙 田生伟 李莉 王梅关键词:分子指纹