张白妮
- 作品数:6 被引量:42H指数:3
- 供职机构:华为技术有限公司更多>>
- 发文基金:湖南省自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学生物学更多>>
- 基于多维伪F统计量的基因表达动态聚类分析方法研究被引量:12
- 2006年
- K-均值聚类分析算法是一种广泛应用于基因表达数据聚类分析中的迭代变换算法,它通过指定类别数K,基于给定的聚类目标函数,并采用迭代更新的方法,使得最终的聚类结果的目标函数值为极小值,达到较优的聚类效果。针对K-均值聚类分析算法存在参数依赖性强,且在整个聚类过程中类的数目无法改变的缺点,引入动态调整聚类个数的思想和多维伪F统计量,提出了一种基于多维伪F统计量的基因表达动态K-均值聚类算法。实验结果表明该算法可以动态调整聚类个数,给出最佳聚类数目,从而获得较好的聚类质量。
- 骆嘉伟李仁发张白妮
- 关键词:聚类分析基因表达数据
- 一种选择性丢包机制的分析与设计被引量:1
- 2004年
- 随机早期检测算法(RED)在产生丢包时简单地丢弃到达的数据包,由于Web流占据了网络上75%左右的带宽,而Web流的特点是数据包比较少,这就使得早期丢包的效果难以体现。本文提出一种选择性丢包机制,引进一个类似公平队列的虚队列,检测发送速率过大的流,筛选出丢包的候选链接,拥塞时丢弃候选链接在队列中的第一个连接的数据包。模拟实验结果表明,与队头丢包相比,采用选择性丢包的RED算法可进一步降低网关的丢包率,提高吞吐率,缩短Http的响应时间,提高队列的稳定性。
- 汤德佑骆嘉伟张大方黄元江张白妮
- 关键词:RED数据包拥塞控制队列管理
- 一种提高稳定性和公平性的主动队列管理机制被引量:8
- 2005年
- 结合平均队列和负载衡量拥塞,实现选择性丢包,提出早期选择性丢包算法(ESD).ESD采用指数函数计算丢包概率,使丢包概率随拥塞程度增大而指数递增;引入记录活跃连接状态信息的虚队列,并在虚队列上假轮转,以检测发送速率大的连接;区分非响应性连接和响应性连接,挑选丢包的候选连接,拥塞时优先丢弃候选连接在队列头部的数据包.实验结果表明,ESD可提高队列稳定性,降低Web流和RTT较大连接的丢包率,提高连接占用带宽的公平性,缩短应用响应时间.
- 汤德佑骆嘉伟张大方张白妮
- 关键词:主动队列管理
- 动态的K-均值聚类算法在图像检索中的应用被引量:19
- 2004年
- 聚类分析技术已经广泛应用于基于内容的图像信息挖掘领域,该技术提高了图像检索的速度和质量。K-均值算法和自适应算法是两个典型的聚类分析算法,但K-均值算法严重依赖于经验参数和阙值的设定;自适应算法得到的聚类个数太多,相应的就是类内的图像个数过少,效率不是很高。从选取初始聚类点是否具有确定性、迭代次数是否过多和聚类个数是否适当等方面考虑,提出了一种新的聚类算法,即动态的K-均值法。模拟实验的结果表明,该算法具有较好的准确性和效率,使检索的质量和速度都得到了很大的提高。
- 张白妮骆嘉伟汤德佑
- 关键词:K-均值聚类图像检索K-均值算法聚类算法自适应算法
- 基于比对相似度动态矩阵聚类算法在基因序列中的应用被引量:3
- 2004年
- 基于BAG图的聚类算法 ,利用聚类单元引导类的分割 ,保证聚类结果不会产生过多的类碎片 ,但其相似分数阈值Cutoff初始值和最长公共子串最小长度阈值Threshold如何确定并没有明确给出。提出基于比对相似度动态矩阵的聚类算法 ,并在此基础上明确给出了确定cutoff初始值和Threshold阈值的方法。实验结果表明该算法可以获得较好的聚类正确率。
- 张白妮骆嘉伟汤德佑
- 关键词:生物序列聚类最长公共子串
- 基因数据聚类分析研究
- 生物学和医学的迅速发展以及基因芯片的逐步实用化都使得同时比较和研究大量基因的特性成为可能,随之产生了海量的基因数据。通过分析这些数据可以获得对人类有益的有关生物结构和功能的信息,对基因数据的分析研究已成为生命科学、数学科...
- 张白妮
- 关键词:基因数据聚类分析动态矩阵
- 文献传递