江苏省自然科学基金(BK2002057)
- 作品数:12 被引量:30H指数:3
- 相关作者:孙啸谢建明汪德正陆祖宏夏小俊更多>>
- 相关机构:东南大学南京中医药大学教育部更多>>
- 发文基金:江苏省自然科学基金国家高技术研究发展计划国家自然科学基金更多>>
- 相关领域:医药卫生自动化与计算机技术生物学更多>>
- 跨平台基因表达模式分析软件系统被引量:1
- 2004年
- 构建了可在不同操作系统平台之间通用的基因表达模式分析软件系统。该软件集成了多种基因表达模式分析算法,并通过模块化设计保持了算法的可扩展性。同时具有原始数据可视化和过滤、多种相似性度量选择、聚类方法选择、表达模式匹配查询、计算结果可视化等功能。软件使用Java作为开发平台,具有良好的可移植性,为在高性能计算机上进行基因表达模式分析打下了良好的基础。
- 胡弘谢建明汪德正孙啸
- 关键词:跨平台软件系统
- 基因调控数据自动处理系统的设计及实现
- 2005年
- 随着人类基因组测序工作的完成,产生了大量的生物数据,这些数据以不同的形式分布在世界各地。为使基因调控和表达信息相关联,建立了基因调控信息集成数据库系统。由于数据来源分布广泛且数据格式不统一,影响了数据库的数据集成。此研究使用了网络智能代理的相关技术,自动下载Web数据,并且进行处理,从中提取出启动子、调控因子、结合位点等有效数据。本程序大大减轻了将网络数据集成到本地数据库的负担。
- 李石法吴俊夏小俊翁建洪孙啸
- 关键词:基因调控启动子
- 再测序DNA微阵列的等长变覆盖探针设计方法被引量:2
- 2004年
- 针对再测序DNA微阵列的寡核苷酸探针设计 ,提出了 2种等长变覆盖的方法 :①基于Tm距离的探针优化方法 ,从冗余探针集中逐步删除具有最大Tm 距离的探针 ;②应用遗传算法 ,将候选探针集编码为染色体 ,通过选择、交叉和变异等遗传操作得到最大适应度的探针集 .这 2种方法 ,都能在探针长度相等的情况下 ,通过改变相邻探针之间的覆盖度使探针的Tm 值尽可能保持一致 .实验结果表明 :等长变覆盖法得到的探针集整体优于等长移位法和变长变覆盖法的结果 ,具有更好的杂交条件一致性 .
- 谢建明方辉胡弘陆祖宏孙啸
- 关键词:探针设计遗传算法
- 基于特征的核酸序列数据库搜索系统被引量:1
- 2006年
- 随着后基因组时代的到来,建立生物数据库并且在其上开发各种分析工具进行数据分析和挖掘,已经成为了生物学研究的一种新方法。目前国际上流行的通过序列比对搜索相似序列的方法主要是针对短的序列,将这样的方法应用于大规模基因组序列时搜索速度很慢。针对基因组序列搜索的特点,从提高序列搜索效率出发,提出了一种新的、速度更快的搜索方法,其核心是通过序列特征的分析和比较搜索相似序列。在此基础上,建立了基于特征的序列数据库搜索系统,并利用序列的碱基关联性特征搜索人类基因组序列,结果表明,新搜索方法具有较高的命中率,并且搜索速度非常快,适合于大规模基因组序列的搜索。
- 焦典顾珉傅静李石法谢建明孙啸
- 关键词:基因组数据库
- 基于内插马尔可夫模型的Gibbs改进算法识别调控元件
- 2006年
- 不同阶数插值形式的马尔可夫内插模型,可以表示在一个DNA序列中相邻核苷酸之间的前后关系的变化。本研究将内插马尔可夫模型引入Gibbs采样算法,识别基因上游序列中的调控元件。对模拟序列和10组来源于文献的酵母基因序列的测试结果表明,改进后的算法在识别保守性差的调控元件和抗噪声能力方面均优于传统的Gibbs采样算法。
- 谢雪英孙啸谢建明陆祖宏
- 关键词:GIBBS采样调控元件基因序列
- SARS病毒与其他冠状病毒的基因组比较
- 2003年
- 本文利用生物信息学方法比较SARS病毒和其他冠状病毒基因组。通过数据库搜索,找出与SARS病毒基因组相似的核酸或蛋白质序列,并对相似序列进行比对,分析它们的共性和差异。结果表明,SARS病毒在基因组的组织上及结构蛋白质方面与现有冠状病毒有比较大的相似性,SARS病毒基因组与冠状病毒基因组相关。但是,SARS病毒基因组还存在一些特异性序列,ORF1a和S蛋白(特别是S1)的变化以及SARS-CoV特异性的非结构蛋白可能是SARS发病机理与传染特性区别于其他冠状病毒的分子基础。在全基因组水平上进行核酸单词出现频率分析,结果表明,SARS病毒远离已知的其他冠状病毒,单独成为一类。
- 孙啸谢建明周士新谢雪英陆祖宏
- 关键词:SARS病毒冠状病毒基因组
- 学习科学相关基因数据库的构建被引量:4
- 2004年
- 利用生物信息学方法和技术 ,收集、整理、集成分散在多个数据库和文献中与学习科学相关的基因信息 ,建立与学习科学相关的基因数据库。数据库提供基因数据管理和查询功能。数据库的管理 ,采用在线管理方式 ,可向数据库添加、修改、删除记录 ,及时、有效地管理数据库。在数据库查询方面 ,提供关键词查询方式、染色体浏览查询方式、基因列表浏览查询方式和行为特征分类浏览查询方式。
- 陈亮顾珉陶怡谢建明孙啸
- 关键词:生物信息学基因数据库
- 基于图像投影的基因芯片图像网格定位被引量:13
- 2005年
- 对基因芯片图像进行网格定位是芯片分析的前提和关键。利用芯片图像在水平方向和竖直方向的投影,可将二维图像分析问题转化为一维信号处理问题。本文对图像的投影信号进行算术平均滤波,然后利用不同参数滤波后投影信号间的灰度偏差进行网格定位。实验表明该方法对芯片信号点的定位有很高的准确性,且算法简单易行。
- 胡园园孙啸何农跃汤建新
- 关键词:基因芯片网格信号处理芯片分析
- 基于频繁序列的新词挖掘算法
- 2006年
- 生物医学领域信息量的飞速增长,极大地促进了人们的交流和研究,同时也使人们在海量的信息面前无所适从:这就提出了对信息进行分类筛选的需求。词库对于文本分类的结果有着至关重要的作用,只有能实时更新新词的词库才能适应使用的需要。该文章提出并实现一种基于频繁序列的新词挖掘算法,能够正确提取出中文文本中的新词,从而及时更新维护词库,使文本分类更为准确。
- 周俊孙啸
- 关键词:分词文本分类
- 基于网络智能代理的基因调控信息集成数据库更新被引量:7
- 2004年
- 在现有基因调控信息数据的基础上,建立了一个基因调控信息集成数据库系统。使用了网络智能代理的相关技术,在对本地和远程数据进行灵活地比对之后,分三种情况实现了对本地数据的更新操作。本程序大大减轻了数据库维护的负担,同时也具有很大的灵活性,可扩展性较强。
- 夏小俊汪德正孙啸
- 关键词:智能代理数据库数据更新