曾安 作品数:66 被引量:320 H指数:10 供职机构: 广东工业大学计算机学院 更多>> 发文基金: 国家自然科学基金 广东省自然科学基金 广州市科技计划项目 更多>> 相关领域: 自动化与计算机技术 医药卫生 金属学及工艺 文化科学 更多>>
云计算环境下面向领域的数据挖掘服务平台研究 被引量:18 2014年 为促进数据挖掘开发及其商业应用,采用云计算技术、领域工程和数据挖掘等技术,结合领域驱动设计和云计算框架,提出了一种面向领域的数据挖掘云平台框架,并阐述了云计算环境下面向领域的数据挖掘服务的机理。定义了面向领域的数据挖掘云平台服务开发模式,这对面向领域的数据挖掘、云计算环境下的数据挖掘服务模式以及数据挖掘服务的开发和应用都有一定的参考价值。 曹小春 曾安 潘丹关键词:云计算 数据挖掘 基于多网络数据协同矩阵分解预测蛋白质功能 被引量:1 2017年 准确预测蛋白质功能是生物信息学的核心任务之一,也是人工智能在生物数据分析中的重要应用点之一.高通量技术的广泛应用产生了大量的生物分子功能关联网络,整合这些网络可更为全面地分析理解蛋白质功能机理,提升蛋白质功能预测精度.已有多种基于数据整合的蛋白质功能预测方法,但它们通常难以应用到较大功能标签空间,未利用标签间关联性和差异性整合多个网络.提出一种基于多网络数据协同矩阵分解的蛋白质功能预测方法(ProCMF).该方法首先利用非负矩阵分解将蛋白质-功能标签关联矩阵分解为2个低秩矩阵,挖掘蛋白质与标签之间的潜在关联.其次,为利用标签间关联关系和多种蛋白质特征数据,ProCMF分别基于上述2个低秩矩阵定义平滑正则性,约束指导低秩矩阵的协同分解.为了差异性地集成多个网络,ProCMF对不同的网络设置不同的权重.最后ProCMF将上述目标统一到一个目标方程中,并用一种交替迭代的方法分别优化求解低秩矩阵和网络权重.在酵母菌、人类和老鼠3个模式物种的多网络数据集上的实验结果表明:ProCMF获得了较其他相关算法更好的预测性能,ProCMF能有效地处理大量的功能标签和区分性地整合多个网络. 余国先 王可尧 傅广垣 王峻 曾安关键词:蛋白质功能预测 网络集成 非负矩阵分解 基于最大信息系数的贝叶斯网络结构学习算法 被引量:4 2017年 在引入最大信息系数的基础上,提出一种改进的贝叶斯网络结构学习算法。在给定数据集的条件下,基于最大信息系数对变量间的关联度进行检测,根据筛选因子和关联度构造贝叶斯网络的初始化结构,并结合贪婪算法对初始网络结构进行局部优化,将局部最优解进行整合形成全局最优解,生成最终的网络结构。在Asia和Car基准网络上的实验结果表明,与基于传统贪婪算法、随机K2算法的贝叶斯网络结构学习算法相比,该算法可以学习到与基准网络更相近的贝叶斯网络结构,并且具有较高的正确边均值和分类准确率。 曾千千 曾安 潘丹 杨海东 邓杰航关键词:贝叶斯网络 贪婪算法 融合注意力机制的阿尔茨海默症识别模型 被引量:2 2021年 本研究针对阿尔茨海默症(Alzheimer′s disease,AD)不同阶段人群难以识别区别的问题,提出一种融合注意力机制的AD识别模型。该方法利用脑区模板标签(Automated anatomical labeling,AAL)划分受试者的大脑区域,将同一脑区中具有相同属性价值的体素数据组织在一起,并分别构造每个脑区所对应的基分类器。同时,受深度学习与计算机视觉注意力机制相关工作的启发,提出一种直映式注意力机制,提高了识别模型的准确率以及稳定性。通过利用直推式支持向量机对基分类器的设计进行优化,进一步提高了识别模型的准确率。实验结果表明,该方法具有良好的分类效果,为其它脑疾病诊断提供了新思路。 曾安 高征关键词:阿尔茨海默症 体素 直推式支持向量机 基于sMRI的阿尔茨海默症分类影响因素研究 被引量:5 2018年 本研究提出基于三类解剖特征的SVM建模方法,探索样本、特征及算法选择三个因素,对阿尔茨海默症(AD)及其前驱阶段分类的重要性。该方法以三维重构s MRI后不同大脑区域的灰质体积、皮层表面积及其平均厚度三类特征作为SVM模型的输入参数,并采用十折交叉验证方法对AD患者、轻度认知损害患者和健康者进行分类识别,并与其他文献结果进行比较分析。实验结果表明,为了达到更高的分类准确率,选择合适的样本和特征,比选择算法更重要。此结论为未来AD的计算机辅助诊断研究工作提供了有益的指导。 黎建忠 曾安 潘丹 潘丹 郭慧 王卓薇关键词:阿尔茨海默症 轻度认知损害 支持向量机 基于MIC的深度置信网络研究 被引量:2 2016年 传统的深度置信网络(DBNs)训练过程采用重构误差作为RBM网络的评价指标,它能在一定程度上反映网络对训练样本的似然度,但它并不是可靠的。而最大信息系数(MIC)能反映两个属性间的相关度,保留相关度较大的属性,且MIC较稳健,不易受异常值的影响,可作为网络评价指标。故提出一种基于最大信息系数(MIC)的深度置信网络方法,一方面用MIC对数据进行降维预处理,提高数据与网络的拟合度,降低网络分类误差;另一方面将MIC作为网络评价标准,改进重构误差的不可靠性。分别利用传统方法与基于MIC的深度置信网络方法对手写数据集MNIST和USPS进行分类实验,结果表明,基于MIC的深度置信网络方法能有效地提高识别率。 曾安 郑齐弥关键词:重构误差 降维 基于三维点云的植物多任务分割网络 被引量:2 2023年 在植物表型研究中,植物器官分割是实现无损、高通量、自动化表型测量的重要步骤。然而,现有植物器官分割方法通常需要凭借经验设置合理的阈值参数,且很少同时执行语义分割和实例分割。该研究提出了一个基于三维点云的植物多任务分割网络(a multi-task segmentation network for plant on 3D point cloud,MT-SegNet),结合多值条件随机场(multi-value conditional random field,MV-CRF)模型,同时实现茎、叶语义分割和叶实例分割。在MT-SegNet中,为解决用最大池化或平均池化方法来聚合邻域点特征可能会导致重要信息丢失的问题,该研究提出了一种基于注意力机制的多头注意力池化模块。它能自动学习到重要的邻域点特征,从而有利于提高网络的分割性能。同时,MT-SegNet分成两个不同的分支,分别用于预测点的语义类别和将这些点嵌入到高维向量,以便将这些点聚类为实例。最后,使用MV-CRF进行多任务的联合优化。在彩叶芋点云数据集上的试验结果表明,该方法的茎、叶语义分割的交并比、准确率、召回率和F1分数的平均值分别为84.54%、93.64%、91.39%、92.48%,叶实例分割的平均准确率、平均召回率、平均实例覆盖率和平均加权实例覆盖率分别为88.10%、78.44%、76.24%、76.93%,均优于PointNet、JSNet等现有的深度学习网络。该模型也适用于类似植物的点云分割类任务。这有助于为植物自动化表型测量提供必要的技术条件。 曾安 罗琳 潘丹 冼志恒 江旭 冼钰伦 刘立程关键词:三维点云 基于粗集的T细胞表位预测方法 被引量:3 2007年 T细胞表位预测技术对于减少实验合成重叠肽、研究病原体与机体作用的免疫机制以及深入理解T细胞介导的免疫特异性均有重要意义。为增强T细胞表位预测模型的可理解性,本文在通过肽的预处理构建出存储等长肽段的决策表之后,设计出了一种基于粗集的T细胞表位预测方法。该方法由基于信息熵的属性约简完备算法和基于锚点知识的属性值顺序约简改进算法共同组成。基于HLA-DR4(B10401)编码的MHCII类分子结合肽的实验数据表明,在预测精度与传统神经网络方法大致相当的基础上,本文方法可以提取出用于帮助专家理解MHC分子与抗原肽结合机理的产生式规则。 曾安 潘丹 郑启伦 彭宏关键词:粗集 基于3D卷积神经网络-感兴趣区域的阿尔茨海默症辅助诊断模型 被引量:5 2020年 磁共振(magnetic resonance imaging,MRI)图像的预测分类对早期阿尔茨海默症(Alzheimer′s disease,AD)的诊断非常重要。轻度认知障碍(mild cognitive impairment,MCI)作为AD的一种早期阶段,在诊断时存在大脑脑区萎缩区域不明确,诊断准确率偏低等问题。本研究提出一种基于感兴趣区域(regions of interest,ROI)的3D卷积神经网络(convolutional neural network,CNN)模型来解决AD分类准确率偏低等问题,进而实现对AD的计算机辅助诊断。实验数据均来自ADNI数据库,实验结果表明,基于ROI的3D CNN的AD辅助诊断模型在分类AD vs正常对照(normal control,NC)、MCI转化AD(MCI converted to AD,MCIc)vs NC和MCI未被转化AD(MCI not converted to AD,MCInc)vs MCIc的5折交叉验证平均准确率分别为85.2%、83.9%、68.5%。相比于传统的主成分分析+支持向量机方法和单纯的切片集成方法,本研究方法在AD辅助诊断中取得了更好的分类效果和泛化能力,还可为其他脑疾病诊断提供新思路。 曾安 邹超 潘丹关键词:阿尔茨海默症 卷积神经网络 感兴趣区域 基于好友关系和标签的混合协同过滤算法 被引量:8 2017年 针对传统推荐算法存在数据稀疏影响推荐效果的问题,考虑到社交网络中的链路预测能够综合考虑用户节点之间的拓扑结构,以及好友关系能反映用户的兴趣爱好,提出了一种融合好友关系和标签信息的推荐算法。首先,借助网络资源分配算法对社交网络的结构信息进行特征提取;然后,利用TF-IDF构建合理的社会化标签模型;最后,利用线性模型融合两方面的信息,从而实现推荐。在Last.fm和Delicious数据集上的实验表明,与传统算法相比,所提算法在推荐的召回率和准确率指标上有显著提高。 曾安 徐小强关键词:链路预测 社交关系 标签 TF-IDF