易丽君
- 作品数:4 被引量:4H指数:1
- 供职机构:中南大学信息科学与工程学院更多>>
- 发文基金:国家自然科学基金中国博士后科学基金国家杰出青年科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于基因表达谱的数据挖掘方法研究
- 基于基因表达谱在分子水平上对肿瘤进行分析和研究,是当前生物信息学研究的重要课题。本文将数据挖掘技术应用在基因表达谱分类分析领域,对特征提取及肿瘤亚型识别问题进行了研究,取得如下研究成果:
提出了基于神经网络和线...
- 易丽君
- 关键词:基因表达谱特征选取支持向量机数据挖掘生物信息学小波分析
- 文献传递
- 基于闭合模式的高维基因表达谱多类分类被引量:1
- 2008年
- 针对多类高维基因表达谱的特点,提出一种基于闭合模式的多类分类算法CBCP,即根据垂直格式的数据集采用路径枚举的方法挖掘闭合模式,极大地减少了冗余模式的产生。然后,对所有闭合模式进行排序,通过覆盖训练集建立分类器。针对分类器无法识别的样本提出权重算法进行判断,克服了使用Default类预测不精确的问题。研究结果表明,CBCP与经典分类算法如CBA和C4.5相比具有更高的预测准确率,并且在基因数大幅增加而样本数不变的情况下仍具有较强的稳定性,证明CBCP的可扩展性强,适用于高维数据集的多类分类预测。
- 李宏李翔吴敏陈松乔易丽君
- 关键词:关联规则
- 基于闭合模式的高维生物数据分类算法研究被引量:2
- 2007年
- 针对基因表达谱数据的特点提出了基于闭合模式的FEALL分类算法.首先对数据进行预处理,剔除表达谱中的无关基因,从而降低FEALL算法的时间复杂度,减少冗余关联规则的产生;然后根据FEALL算法对行集建立行FP-tree,并对每行建立路径枚举树,挖掘出兴趣规则组的上边界,基于上边界建立分类器对样本进行分类预测,无法识别的样本采用权重判断算法进行判断.实验证明FEALL算法具有较高的效率和预测准确率.
- 李宏陈松乔易丽君周明李翔
- 关键词:关联规则
- 特征基因选取及肿瘤亚型识别方法研究被引量:1
- 2007年
- 针对基于基因表达谱数据的多类肿瘤亚型的识别与特征基因选取问题进行了研究;采用Gini指数与“信噪比”(SNR)指标相结合的方法,构建GSNR综合指标,剔除无关基因;然后采用BP神经网络设计复合分类器;最后使用SM算法,并依据独立测试的分类错误数最终确定特征基因子集,以急性白血病的基因表达谱数据为例,按三类肿瘤亚型分类,从7129个基因中选出8个特征基因,其对独立测试集的预测准确度达到97%;实验表明综合指数GSNR对数据进行预处理具有良好的鲁棒性和可伸缩性。
- 李宏易丽君
- 关键词:基因表达谱特征基因人工神经网络