李梦琪
- 作品数:6 被引量:124H指数:5
- 供职机构:北京工商大学计算机与信息工程学院更多>>
- 发文基金:国家自然科学基金北京市自然科学基金教育部人文社会科学研究基金更多>>
- 相关领域:自动化与计算机技术理学更多>>
- 基于节点向量表达的复杂网络社团划分算法被引量:11
- 2019年
- 社团结构划分对复杂网络研究在理论和实践上都非常重要.借鉴分布式词向量理论,提出一种基于节点向量表达的复杂网络社团划分方法(CDNEV).为了构建网络节点的分布式向量,提出启发式随机游走模型.利用节点启发式随机游走得到的节点序列作为上下文,采用SkipGram模型学习节点的分布式向量.选择局部度中心节点作为K-Means算法的聚类中心点,然后用K-Means算法进行聚类,最终得到社团结构.在真实和模拟两种网络上做了丰富的实验,与主流的全局社团划分算法和局部社团划分算法作了比较.在真实网络上CDNEV算法的F1指标比其他算法平均提高19%;在模拟网络上,F1指标则可以提高15%.实验结果表明,相对其他算法,CDNEV算法的精度和效率都较高.
- 韩忠明刘雯刘雯李梦琪谭旭升段大高
- 关键词:复杂网络社团结构
- 一种有效的基于三角结构的复杂网络节点影响力度量模型被引量:30
- 2016年
- 度量复杂网络中的节点影响力对理解网络的结构和功能起着至关重要的作用.度、介数、紧密度等经典指标能够一定程度上度量节点影响力,k-shell和H-index等指标也可以应用于评价节点影响力.然而这些模型都存在着各自的局限性.本文基于节点与邻居节点之间的三角结构提出了一种有效的节点影响力度量指标模型(local triangle centrality,LTC),该模型不仅考虑节点间的三角结构,同时考虑了周边邻居节点的规模.我们在多个真实复杂网络上进行了大量实验,通过SIR模型进行节点影响力仿真实验,证明LTC指标相比于其他指标能够更加准确地度量节点的传播影响力.节点删除后网络鲁棒性的实验结果也表明LTC指标具有更好效果.
- 韩忠明陈炎李梦琪刘雯杨伟杰
- 关键词:复杂网络
- 网络评论方面级观点挖掘方法研究综述被引量:32
- 2018年
- 网络评论的观点挖掘任务是文本分析的关键问题之一.随着网络评论的快速增长,用户在浏览评论时更加关注细粒度的信息,因此,对评论进行方面级观点挖掘能够帮助消费者更好地做出决策.过去的10多年间,研究人员在大量网络评论语料库上进行观点挖掘等相关研究,并取得了丰硕的研究成果和广泛的应用价值,更不乏优秀学者对观点挖掘方法现状进行综述总结.然而,有针对性地对观点挖掘中的方面提取与观点提取进行综述总结的成果较少.综述了近年来网络评论方面级观点挖掘的研究现状:首先,介绍了方面级观点挖掘的相关问题描述;然后,重点分类介绍方面提取方法及观点内容提取的主要方法;随后,总结了方面级观点挖掘的常见评价指标以及在社会中的广泛应用价值;最后,根据对现有方法提出具有挑战性的方向并进行系统总结.对方面级观点挖掘进行综述有助于比较不同方法的差异,从而发现有价值的研究方向.
- 韩忠明李梦琪刘雯张梦玫段大高于重重
- 关键词:网络评论
- 社会网络节点影响力分析研究被引量:48
- 2017年
- 社会网络节点影响力研究是社会网络分析的关键问题之一.过去的10多年间,随着在线社会网络的快速发展,研究人员有机会在大量现实社会网络上对影响力进行分析和建模,并取得了丰硕的研究成果和广泛的应用价值.分析和总结了近年来社会网络影响力分析的主要成果.首先介绍了节点影响力的相关定义、作用范围以及表现形式;接着,重点分类介绍了节点影响力的度量方法,通过网络拓扑、用户行为和内容分析这3类方法总结了影响力的建模和度量方法;然后总结了影响力的传播和最大化模型相关成果;最后介绍了影响力的评价指标和应用.根据对现有方法的系统总结,对社会网络影响力的未来研究提出了一些值得关注的方向.
- 韩忠明陈炎刘雯原碧鸿李梦琪段大高
- 关键词:社会网络信息传播
- 面向复杂主题建模的流式层次狄里克雷过程被引量:6
- 2019年
- 互联网已经成为真实事件信息的主要来源.针对互联网海量新闻语料的主题挖掘是新闻事件的组织和追踪任务中关键的一环.主题模型已被广泛应用于挖掘和分析新闻等文本语料,LDA(Latent Dirichlet Allocation)是最常见的主题模型,然而现有基于LDA的方法没有考虑到主题之间的层次关系,且需要预先提供主题个数.作为LDA模型的扩展,层次狄里克雷过程(Hierarchical Dirichlet Process,HDP)是非参数贝叶斯主题模型,HDP能够自动确定主题个数.对于具有层次等特性的复杂主题,HDP难以挖掘出隐式层次结构,且容易产生噪音主题.为了解决这个问题,该文提出了基于HDP改进的非参数贝叶斯模型:流式层次狄里利克雷过程(Flow Hierarchical Dirichlet Process,FHDP),FHDP通过在HDP模型中加入流动操作,加强了对主题之间的同属领域信息的利用,以便于更好的对主题进行层次分析.利用加入了流动操作的中国连锁餐馆模型(Chinese Restaurant Franchise,CRF)对数据进行建模,设计相应的马尔可夫链蒙特卡罗(Markov Chain Monte Carlo,MCMC)采样方法,以推导FHDP模型的分布参数分布.FHDP的主要贡献在于:(1)对含有层次关系的主题建模时,减少了无意义信息.解决了HDP得到主题不明确的问题,扩大了HDP的应用领域;(2)由于在FHDP中加强了对主题隐含领域信息的利用,主题的层次关系变得更加明确.为了客观衡量FHDP和HDP的性能差异,利用模拟和真实数据进行了大量实验.实验表明,在轮廓系数、主题覆盖度、单字对数似然等指标上,FHDP模型明显优于HDP模型。
- 韩忠明张梦玫李梦琪李梦琪段大高
- 关键词:主题模型
- 有效的社会媒体热点话题传播模型研究被引量:1
- 2015年
- 交互式社会媒体上的热点话题具有巨大的影响力,对热点话题进行建模和预测是一个非常重要但困难的问题.针对话题参与用户的特点进行了分析,构建了用户活跃度以及用户重入概率等模型的合理假设条件.根据话题发展模式和基于用户参与话题概率构建了单峰模型和多峰模型.分别基于两个不同数据集对模型进行了拟合和预测试验,试验结果表明,本文提出的模型在拟合与预测话题的发展趋势上的效果都优于SpikeM模型,尤其是对具有复杂波动发展模式的话题,提出的模型能很好地拟合与预测话题的波动.
- 韩忠明张梦李梦琪莫倩刘鹂
- 关键词:时间序列传染病模型