苏振强
- 作品数:5 被引量:8H指数:2
- 供职机构:中国科学技术大学化学与材料科学学院化学系更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术理学环境科学与工程医药卫生更多>>
- 不相交主成分分析(PCA)和遗传算法(GA)用于差异表达基因的识别被引量:1
- 2007年
- 建立了一种基于不相交主成分分析(Disjoint PCA)和遗传算法(GA)的特征变量选择方法,并用于从基因表达谱(Gene expression profiles)数据中识别差异表达的基因.在该方法中,用不相交主成分分析评估基因组在区分两类不同样品时的区分能力;用GA寻找区分能力最强的基因组;所识别基因的偶然相关性用统计方法评估.由于该方法考虑了基因间的协同作用更接近于基因的生物过程,从而使所识别的基因具有更好的差异表达能力.将该方法应用于肝细胞癌(HCC)样品的基因芯片数据分析,结果表明,所识别的基因具有较强的区分能力,优于常用的基因芯片显著性分析(Significance analysis of microarrays,SAM)方法.
- 苏振强HONG Hui—XiaoTONG Wei-DaPERKINS Roger邵学广蔡文生
- 化学数据挖掘技术与药物分子设计应用
- 随着现代科技的发展,生物信息学和化学信息学在新药创制过程中的作用越来越重要,已经成为加速新药研发过程、降低研发成本的关键所在。开发在药物研发过程中易于使用,且效率较高的化学、生物学数据挖掘工具,以帮助药物研发人员进行药物...
- 苏振强
- 关键词:数据挖掘药物设计并行处理聚类分析
- 文献传递
- 基于Globus Toolkit和Sun^(TM) ONE Grid Engine构建计算网格被引量:1
- 2005年
- 网格计算(grid computing)是近几年发展起来的一个崭新研究领域,引起国内外学术界及工业界的广泛关注。其目的是研究如何安全有效地将现有的各种计算资源(尤其是那些分布在Internet的异构网络中的计算资源)组织起来协同解决复杂的科学及工程计算问题。在化学信息学和生物信息学中最典型的应用是虚拟高通量筛选侯选药物分子。本文以两个Linux机群为基础,用开放源码的网格支持软件包Globus Toolkit 3.2及Sun^(TM) ONE Grid Engine 5.3成功构建了计算网格;并通过设计测试程序实现一次性提交多个作业(300个)以及分析作业在计算网格中各个节点的分配及运行情况,从而测试了计算网格的效率。结果表明,所构建的计算网格在保持原机群运行稳定、可靠的前提下,改进了系统资源的分配管理方式以及用户提交作业的方法,从整体上提高了网络计算资源的利用率,也同时方便了系统的管理。
- 苏振强徐佳维蔡文生邵学广
- 关键词:计算网格ONEGRIDENGINE计算机群
- C/S分布式并行处理技术在高速局域网平台上实现非线性环境化学胞映射体系的大规模计算被引量:5
- 2002年
- 通过100Mb/S集线器连接4台双CPU和2台单CPU计算机构成分布式并行计算的局域网平台,采用VC++6.0高效、稳定、方便和成功地实现了分布式多线程并行计算,将非线性环境化学问题的胞映射大规模计算数值解体系进行了有效划分,并合理地分配到局域网上的每一台计算机上的每一个CPU中,然后通过局域网返回各自的处理结果,最后在客户机上完成各单项任务的总装,达到了可持续利用现有计算机资源和大幅度提高计算效率的目的。用这种低成本方式简单、清晰和快捷地掌握并行处理技术十分适应非计算机专业科研人员用来解决超大负荷计算量的复杂问题。
- 刘信安苏振强
- 关键词:分布式并行计算胞映射CLIENT/SERVER局域网
- 多模型共识数据建模方法研究
- 分析化学数据的建模是化学计量学研究的重要内容。根据数据建模的任务不同,可以分为回归校正(regression)和模式识别(pattem recognition)。由于传统的单模型建模方法对数据中的噪声和样本量都比较敏感,...
- 苏振强
- 关键词:分析化学数据建模模式识别