国家自然科学基金(60903086)
- 作品数:5 被引量:9H指数:2
- 相关作者:杨昆戴胜冬黄丽丽顾靓王路路更多>>
- 相关机构:杭州电子科技大学更多>>
- 发文基金:国家自然科学基金浙江省自然科学基金更多>>
- 相关领域:生物学自动化与计算机技术电子电信更多>>
- 集成数据选择特征基因被引量:2
- 2010年
- 特征选择技术在利用基因芯片进行疾病的分类和诊断中起到了关键作用。该文提出了一种新的集成数据选择特征基因的方法;针对多来源数据中的每一个,首先计算每个基因在这一数据上的差异表达统计量,然后用这些统计量来代替这一原始数据进而提取特征。在4个真实的基因表达数据集上对提出的方法进行测试并与对照的方法比较,实验结果显示,提出的方法所选出的特征应用于分类的效果更好。
- 王海鹏杨昆
- 关键词:集成数据基因选择
- 计算DNA序列模式特征的匹配算法被引量:2
- 2015年
- 分析了DNA序列特征计算过程中的特殊性,提出了一种基于"空间换时间"的模式匹配算法,设计了以map数据结构来存储中间结果的方案,使得扫描DNA序列一次即可同时计算所有元组模式在该序列中出现的次数。实验结果及分析表明,算法提升了DNA序列模式特征计算的效率,较好地解决了计算DNA序列模式特征的问题。
- 戴胜冬杨昆
- 关键词:生物信息学DNA序列
- 利用滑动窗口和KNN算法识别差异甲基化区域被引量:1
- 2016年
- 针对现有差异甲基化区域DMRs识别方法中过度删除显著性弱的甲基化位点、DMRs长度受限以及不能直接处理多类的问题,提出了一种利用滑动窗口和KNN算法识别不同类别间DMRs的算法.算法先通过滑动窗口结合KNN分类器筛选候选区域,再根据误差率合并候选区域得到DMRs.真实数据上的实验表明,算法的分类性能、聚类指数明显优于对照算法,扩展了对照的Ong算法识别的DMRs长度,并能发现Ong算法未发现的DMRs.
- 李华兵杨昆
- 关键词:KNN分类器
- 年龄有关的差异甲基化且差异表达基因的特点被引量:2
- 2017年
- 当前DNA甲基化和基因表达之间的复杂关系还没有一个明确结论,年龄上差异甲基化基因的特点有待进一步研究.在年龄间距大的匹配的DNA甲基化和表达的数据上,基于区域分析方法识别年龄上差异甲基化区域,提取差异甲基化且差异表达基因,并集成多种数据鉴别它们的特点.分析结果表明,差异甲基化区域的变化模式在基因坐标区域内具有很高的一致性;Gene Body是DNA甲基化的重要调控区域,大部分差异甲基化区域分布于此区域,高甲基化区域和低甲基化区域分别更易于出现在CGI promoter基因和nonCGI promoter基因;在差异甲基化区域与基因表达水平的关系上,非差异表达/上调/下调的差异甲基化区域都同时存在正关联、负关联和无关联,在上述的复杂关系中,非差异表达的DMR偏向正相关,反之差异表达的DMR偏向负相关;对正关联和负关联的差异甲基化且差异表达基因利用蛋白质互作网络信息进行分类,同时对这两类基因进行GO富集性分析,结果显示,正关联和负关联的差异甲基化且差异表达基因与蛋白质互作的不同功能模块有关联性,提示两类基因很可能关联于不同的表达调控模式.
- 黄丽丽杨昆
- 关键词:年龄
- DNA序列的甲基化特征提取软件被引量:2
- 2012年
- 提取(量化)特征是DNA甲基化状态预测中的一个关键步骤,然而不同的方法所使用的特征并不相同,特征量化的具体过程计算繁琐。本文集成文献中的重要特征,设计并实现了DNA序列的特征提取软件工具。该软件封装了特征的计算过程,可以方便地批量计算目标序列的相关特征,为后续的数据分析和挖掘提供便利。
- 戴胜冬杨昆顾靓王路路
- 关键词:DNA甲基化特征提取CPG岛