您的位置: 专家智库 > >

赵晓鹏

作品数:5 被引量:6H指数:2
供职机构:河北省财政厅更多>>
发文基金:中央高校基本科研业务费专项资金河北省高等学校科学技术研究青年基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 4篇期刊文章
  • 1篇会议论文

领域

  • 5篇自动化与计算...

主题

  • 2篇文档
  • 2篇聚类
  • 2篇聚类模型
  • 2篇类模型
  • 1篇深度图
  • 1篇神经网
  • 1篇神经网络
  • 1篇特征词
  • 1篇同义
  • 1篇同义关系
  • 1篇主题发现
  • 1篇主题模型
  • 1篇网络
  • 1篇文本表示
  • 1篇文本分类
  • 1篇文档聚类
  • 1篇相似度
  • 1篇基于语义
  • 1篇泛化
  • 1篇本体

机构

  • 4篇河北省财政厅
  • 3篇北京交通大学
  • 3篇石家庄经济学...
  • 2篇河北地质大学
  • 1篇河北师范大学
  • 1篇河北地质职工...

作者

  • 5篇赵晓鹏
  • 3篇柴变芳
  • 2篇于剑
  • 2篇贾彩燕
  • 1篇王静红
  • 1篇王荣娟

传媒

  • 1篇南京大学学报...
  • 1篇南京师大学报...
  • 1篇计算机科学与...
  • 1篇计算机科学与...
  • 1篇2012年第...

年份

  • 1篇2024
  • 1篇2022
  • 2篇2014
  • 1篇2012
5 条 记 录,以下是 1-5
排序方式:
大规模网络的三角形模体社区发现模型被引量:4
2014年
研究表明将边表示的网络转换为三角形模体表示形式,可以有效解决基于模型社区发现方法由网络规模庞大带来的计算瓶颈问题.提出一个三角形模体社区发现模型MCDTM(a Model for Community Detection based on Triangular Motifs),其将网络表示为一系列三角形模体,利用categorical分布对各三角形模体的生成过程建模,用最大似然参数估计方法给出参数估计的推理过程,根据参数估计结果可得节点、边及三角形模体的社区隶属度.人工网络和实际网络上的实验证明MCDTM模型可快速准确地发现网络的潜在结构.
柴变芳赵晓鹏贾彩燕于剑
关键词:大规模网络
融合主题模型和图神经网络的无监督文档聚类模型
2022年
TextING (Inductive Text classification via GNN)模型是一种流行的图神经网络文本分类方法,其为每个文档构建词共现文档图,基于GCN (Graph Convolutional Networks)在所有文档词图上学习文档表示,进而通过监督的方式训练文档分类模型。但该方法需要大量文档类别标签,且基于词图的文档表示不能充分学到整个文档集合的全局特征。针对此问题,提出一种无监督的文本分类模型。该模型首先利用ETM (Embedd Topic Model)主题发现模型学习包含全局词特征的文档表示,并对ETM学到的文档主题表示进行Kmeans聚类作为文档的伪类标,再利用TextING训练文档分类模型。在真实文档数据集上的结果表明该方法比主流无监督文档聚类准确性高。
张出阳赵晓鹏柴变芳
关键词:文档聚类主题发现
基于语义相似度的同义关系挖掘算法研究
用本体扩展查询是语义检索的主流方向,如何构建完善的本体是亟待解决的问题,现对本体构建中概念及其同义关系的自动获取进行研究。每个概念用上下文特征词表示,利用完全加权关联规则挖掘概念集,将频繁项作为具有同义关系的概念的特征词...
王静红柴变芳赵晓鹏
关键词:同义关系特征词本体构建
文献传递
基于泛化图卷积神经网络的深度文档聚类模型
2024年
文本分类是自然语言处理中一项重要任务,基于图神经网络的文本分类因其可建模文本间的多种交互成为一种主流方法.但现有方法大都依赖标签,而真实标签难以获取.提出一个基于图泛化卷积神经网络的深度文档聚类模型(generalization graph convolutional neural network-deep document clustering, GGCN-DDC),同时实现文本表示学习和无监督文档分类.该模型首先将每个文档建模为文本图;然后采用泛化卷积层学习更有区分力的文档词特征表示和文档表示;最后通过文档聚类损失和文档图重建损失约束参数学习算法.在3个基准数据集上的实验表明,GGCN-DDC在多个指标上均优于其他基准算法.
柴变芳李政赵晓鹏王荣娟
关键词:文本分类文本表示
内容网络广义社区发现有效算法被引量:3
2014年
在对网络无任何先验知识情形下,PPSB-DC模型(popularity and productivity stochastic block model and discriminative content model)利用网络的内容和链接对网络生成过程进行建模,可有效地发现广义社区及社区间的链接模式。但该概率模型的参数估计算法耗时,初始链接模式参数设置敏感,限制了该模型的应用。对参数求解算法进行了改进,设计了一个有效的内容网络广义社区发现算法EPPSBDC(efficient PPSB-DC)。该算法通过采取抽样和并行技术,提高了算法运行速度,通过引入链接概率先验,消除了算法对初始参数的敏感性。在内容网络上与同类算法进行了比较,验证了EPPSBDC算法的有效性。
柴变芳赵晓鹏贾彩燕于剑
共1页<1>
聚类工具0