您的位置: 专家智库 > >

国家重点基础研究发展计划(2004CB720103)

作品数:10 被引量:93H指数:5
相关作者:朱梅红曹志伟李亦学李爱华赵静更多>>
相关机构:上海生物信息技术研究中心中国科学院中国科学院研究生院更多>>
发文基金:国家重点基础研究发展计划国家自然科学基金北京市自然科学基金更多>>
相关领域:理学生物学经济管理医药卫生更多>>

文献类型

  • 10篇期刊文章
  • 2篇会议论文

领域

  • 3篇自动化与计算...
  • 3篇理学
  • 2篇经济管理
  • 2篇生物学
  • 2篇医药卫生
  • 1篇农业科学
  • 1篇文化科学
  • 1篇自然科学总论

主题

  • 4篇数据挖掘
  • 3篇生物信息
  • 3篇生物信息学
  • 2篇代谢网络
  • 2篇线性规划
  • 1篇多目标线性规...
  • 1篇信息化
  • 1篇序贯抽样
  • 1篇正则
  • 1篇支持向量
  • 1篇支持向量机
  • 1篇知识管理
  • 1篇知识获取
  • 1篇知识驱动
  • 1篇指标体系
  • 1篇软件测试
  • 1篇软件缺陷度量
  • 1篇省份
  • 1篇数据仓库
  • 1篇数据集

机构

  • 5篇中国科学院
  • 3篇中国科学院研...
  • 3篇上海生物信息...
  • 2篇电子科技大学
  • 2篇上海交通大学
  • 1篇首都经济贸易...
  • 1篇中央财经大学
  • 1篇中国科学院上...

作者

  • 3篇朱梅红
  • 3篇曹志伟
  • 2篇石勇
  • 2篇李亦学
  • 2篇李爱华
  • 2篇赵静
  • 1篇郝沛
  • 1篇王晓婧
  • 1篇李兴森
  • 1篇鹿盟
  • 1篇俞鸿
  • 1篇彭怡
  • 1篇彭怡
  • 1篇张东玲
  • 1篇王庆康
  • 1篇申爱华
  • 1篇张欣
  • 1篇寇纲
  • 1篇屠康
  • 1篇孙景春

传媒

  • 3篇科学通报
  • 1篇数学的实践与...
  • 1篇统计与决策
  • 1篇高技术通讯
  • 1篇中国科学院研...
  • 1篇Scienc...
  • 1篇Scienc...
  • 1篇当代经济管理

年份

  • 3篇2009
  • 2篇2008
  • 3篇2007
  • 4篇2006
10 条 记 录,以下是 1-10
排序方式:
基于熵权的中国西部各省份科技实力综合评价被引量:27
2006年
构建了西部十二省份科技实力综合评价的指标体系,运用基于熵值的赋权法对指标赋权,并采用线性加权模型进行加权综合评分.然后对各省份的综合科技实力以及各层次的科技实力进行比较和分析.为验证熵值法评价结果的可靠性,又将该方法的结论与用标准差系数法和主观赋权法的结论进行比较,发现熵值法与后两种方法得到的结论高度一致.说明熵值法的结论和由此展开的分析是可靠的,有价值的.
朱梅红李爱华
关键词:综合评价指标体系
基于领域知识的数据挖掘理论框架研究
近年来,数据挖掘(Data Mining and Knowledge Discovery)的研究侧重于模型和算法的建立或改进,而数据挖掘过程中的其他环节未得到足够的重视,导致了诸如:数据预处理周期过长,缺乏对已有知识的再...
彭怡寇纲
关键词:数据挖掘领域知识
文献传递
猪链球菌全基因组序列比较分析被引量:8
2006年
1995年,在四川局部地区爆发的人感染猪链球菌疫情导致200多人感染,30多人死亡.为了研究猪链球菌的致病机理,以达到防止细菌传播和人畜感染的目的,对已测序的猪链球菌(Streptococcussuis)的2个菌株(P1/7,89-1591)进行了全面的功能注释和分析.猪链球菌P1/7的基因组全长为2.007Mb,共有1969个可读框(ORF),而部分测序的猪链球菌89-1591序列包含在177个连接群(contig)中,长为1.98Mb,含有1918个ORF.两菌株基因组比较结果表明,其平均编码区(CDS)的长度非常接近.在所有ORF中,同源ORF数为1306个.两菌株中可能的毒性因子大多数具同源性.但也存在例外,如在P1/7中存在于一个基因岛内,编码与毒性相关的荚膜多糖的11个毒性因子(CPS2A-2K)中,4个基因cps2A,2B,2I,2J未在89-159菌株中发现.同时,P1/7中编码细胞外因子(EF)和溶血素(Haemolysin)的基因也未在89-159菌株中发现.另外,两菌株中与DNA复制、修复及重组相关的基因组成上存在着明显的差异,并且在表面蛋白质组成上也同样存在着一定的差异.这些特性表明两菌株为了适应不同的环境压力而演化出特有的功能单位,暗示着2个菌株在毒性机理上存在着一定的差异.以上分析结果为系统地研究猪链球菌以及防治、疫苗的开发、治疗药物的设计提供了广泛的基因组学信息.
魏武丁国徽王晓婧孙景春屠康郝沛王川曹志伟石铁流李亦学
Regularized multiple criteria linear programs for classification
2009年
Although multiple criteria mathematical program (MCMP), as an alternative method of classification, has been used in various real-life data mining problems, its mathematical structure of solvability is still challengeable. This paper proposes a regularized multiple criteria linear program (RMCLP) for two classes of classification problems. It first adds some regularization terms in the objective function of the known multiple criteria linear program (MCLP) model for possible existence of solution. Then the paper describes the mathematical framework of the solvability. Finally, a series of experimental tests are conducted to illustrate the performance of the proposed RMCLP with the existing methods: MCLP, multiple criteria quadratic program (MCQP), and support vector machine (SVM). The results of four publicly available datasets and a real-life credit dataset all show that RMCLP is a competitive method in classification. Furthermore, this paper explores an ordinal RMCLP (ORMCLP) model for ordinal multigroup problems. Comparing ORMCLP with traditional methods such as One-Against-One, One-Against-The rest on large-scale credit card dataset, experimental results show that both ORMCLP and RMCLP perform well.
SHI YongTIAN YingJieCHEN XiaoJunZHANG Peng
关键词:线性规划正则数据集中支持向量机
甲型H1N1流感病毒HA蛋白结构模建与构象表位分析被引量:6
2009年
最近几个月来,一种新型流感病毒H1N1在全球流行.本文运用生物信息技术,从NCBI发布的新型AH1N1流感病毒基因序列出发,通过同源模建方法构建了HA蛋白三维结构,利用自主开发的蛋白抗原空间表位预测程序SEPPA预测了HA蛋白潜在空间表位氨基酸,并与以往流感病毒HA蛋白潜在构象表位进行了比较.结果发现HA蛋白中58个氨基酸残基具有较强的免疫原性,大部分在HA蛋白球状头部表面上聚集成簇,构成空间抗原表位.与以往流感病毒HA蛋白潜在空间表位相比,虽然坐落位置相似,但新的抗原表位在静电势性质上明显不同于以往流感病毒HA蛋白抗原表位.
流感研究上海协作组吴迪徐天磊孙静戴建新丁国徽何云刚周正峰熊慧董辉金维荣边超金力王红艳王小宁杨忠钟扬王皓车小燕黄忠蓝柯孙兵吴凡袁政安张曦周晓农周佳海马志永童光志郭亚军赵国屏李亦学曹志伟
关键词:生物信息学
低质量数据下的知识获取方案研究被引量:2
2007年
数据挖掘已经成为重要的知识来源。随着信息化的深入,企业对数据挖掘有了较大的需求,但数据质量差往往会造成数据挖掘的结论可信度低,从而影响了数据挖掘的应用。本文以可拓学方法,通过系统分析产生脏数据的原因,提出了基于学科链方法的数据清洗方案。通过数据挖掘手段发现数据质量差距,追溯到软件设计、实施、维护等上游环节,提出从来源环节解决问题的系统方法,并提出通过数据挖掘应用咨询促使数据质量改进的措施,从而降低数据清洗的工作量,使数据质量不高的企业也可以实施数据挖掘项目,获取决策支持所需的知识。
李兴森石勇鹿盟申爱华
关键词:数据质量数据挖掘知识管理可拓学企业信息化
应用复杂网络理论研究代谢网络的进展被引量:23
2006年
后基因组生物信息学研究的一个重要任务是系统地研究活细胞内所有分子和它们之间的相互作用,从而了解这些分子及它们之间的相互作用对整个生物体功能的影响.而网络则是对各种相互作用关系的恰当的抽象描述.近年来,复杂网络理论在揭示各种复杂的技术网络和社会网络的形成和演化机制方面取得了一些重要成果,其方法和结果已对生物学研究产生影响.本文评述了基于基因组的大规模代谢网络重建和分析的进展,论述了利用复杂网络理论分析代谢网络结构的主要方法和结果.
赵静俞鸿骆建华曹志伟李亦学
关键词:生物信息学系统生物学代谢网络网络结构
Bow-tie topological features of metabolic networks and the functional significance被引量:22
2007年
Exploring the structural topology of genome-based large-scale metabolic network is essential for in- vestigating possible relations between structure and functionality.Visualization would be helpful for obtaining immediate information about structural organization.In this work,metabolic networks of 75 organisms were investigated from a topological point of view.A spread bow-tie model was proposed to give a clear visualization of the bow-tie structure for metabolic networks.The revealed topological pattern helps to design more efficient algorithm specifically for metabolic networks.This coarse- grained graph also visualizes the vulnerable connections in the network,and thus could have important implication for disease studies and drug target identifications.In addition,analysis on the reciprocal links and main cores in the GSC part of bow-tie also reveals that the bow-tie structure of metabolic networks has its own intrinsic and significant features which are significantly different from those of random networks.
ZHAO JingTAO LinYU HongLUO JianHuaCAO ZhiWeiLI YiXue
关键词:代谢网络拓扑特征生物信息学
一种快速可变剪接模式搜索算法的研究
2006年
提出了一种快速可变剪接模式搜索算法--ASDT.该算法通过计算cDNA与基因序列的联配结构来寻找基因的可变剪接模式.ASDT计算中引入已知剪接信息,并采用增强后缀数组、块联配延伸和K最大参考路径等技术和方法来提高计算速度.与国外的BLAT软件的比较结果显示,在达到相同计算精度的前提下,ASDT的搜索速度是BLAT的2到16倍.根据ASDT算法开发的工具可以在以下网址获得: http://www.scbit.org/ASDT/.
张欣赵静王庆康曹志伟
关键词:可变剪接EST
三种分类算法偏差-方差结构的比较:MCLP,LDA和C5.0被引量:1
2009年
基于Domingos的期望预测误差分解框架,在3个数据集上,对MCLP、LDA和C5.0这3种算法的偏差-方差结构特点进行了比较分析.实验结果表明,一般来说,C5.0呈现低偏差-高方差的特点,LDA与之相反,而MCLP则介于两者之间,比较接近LDA.当训练集样本量较小时,MCLP的偏差和方差都相对较高,而随着训练集的增大,MCLP的偏差和方差明显减小,甚至低于其他两者.
朱梅红石勇李爱华张东玲
关键词:多目标线性规划线性判别分析
共2页<12>
聚类工具0