刘玮
- 作品数:22 被引量:104H指数:6
- 供职机构:国家互联网应急中心更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家科技支撑计划更多>>
- 相关领域:自动化与计算机技术理学语言文字文化科学更多>>
- 一种面向网络用户的个性化文本排序及推荐方法
- 本发明提供一种面向网络用户的个性化文本排序及推荐方法,所述个性化文本排序方法包括对于用户的每条包括具有关键词和运算符的表达式的兴趣规则,执行以下步骤:1)、对于多个文本中的每个文本提取关键词和该关键词在该文本中的权重。2...
- 程学旗杜慧张瑾黄康平余智华刘悦刘玮
- 文献传递
- 融合热点话题的微博转发预测研究被引量:12
- 2015年
- 微博转发行为是实现信息传播的重要方式,微博转发预测对微博影响力分析、微博话题分析具有重要价值。现有微博转发预测研究大多围绕消息属性、用户属性等微博自身特征,该文提出融合热点话题的微博转发预测方法,对背景热点话题内容和传播趋势对用户转发行为的影响进行量化分析,提出融合背景热点信息的转发兴趣、转发活跃度、行为模式等特征,并基于分类算法建立了面向热点话题相关微博的转发预测模型,在真实数据上的实验结果表明,该方法的预测准确性达到96.6%,提升幅度最高达到12.14%。
- 陈江刘玮巢文涵王丽宏
- 面向话题的微博网络测量研究被引量:7
- 2013年
- 针对话题生成网络的动态时序特性,设计定量计算方法,从微博内容、网络结构、用户行为角度开展面向话题的新浪微博网络测量研究,结果发现:少数微博被大量转发,转发次数与对应微博数呈现近似的幂率分布;话题热度呈现明显的突发性和变化趋势,局部波动率能够有效地在大量背景微博中发现突发话题;基于话题生成的转发网络的小世界特性并不明显,且密集的关注关系不一定引发频繁的转发行为;传播能力强的话题中含有较大比例的持续参与用户,用户行为的话题相关性能够有效检测潜在关键用户。测量结果有助于了解话题生成网络的内容传播特点、网络结构特性及用户行为模式,测量指标能够有效应用于微博话题影响力分析等相关研究。
- 刘玮王丽宏李锐光
- 关键词:网络结构用户行为小世界特性
- 基于特征驱动的微博话题检测方法被引量:3
- 2017年
- 该文针对微博数据稀疏、内容关系难以计算的特点,提出了一种基于特征驱动的微博话题检测方法。提取有意义串作为微博动态特征,根据微博的结构关系计算特征的作者影响力和文档影响力,与内容统计特性共同构成特征的属性组,采用逻辑回归对特征建模,基于属性组对特征二元分类得到话题关键特征,将关键特征之间的互信息作为距离度量,改进最近邻聚类方法对关键特征聚类产生话题。微博数据实验表明,该方法有效提高了微博话题检测的准确率和召回率。
- 贺敏刘玮刘悦王丽宏白硕程学旗
- 关键词:逻辑回归聚类
- 融合热点话题的微博转发预测研究
- 微博转发行为是实现信息传播的重要方式,微博转发预测对微博影响力分析、微博话题分析具有重要价值.现有微博转发预测研究大多围绕消息属性、用户属性等微博自身特征,本文提出融合热点话题的微博转发预测方法,对背景热点话题内容和传播...
- 陈江刘玮巢文涵王丽宏
- 垂直搜索引擎的存储系统设计与实现
- 垂直搜索引擎是相对通用搜索引擎无用信息多、信息挖掘深度浅、查询结果不精确等问题提出的新搜索引擎模式。相比通用搜索引擎,垂直搜索引擎固定范围采集、精准信息抽取和深入信息处理。在大规模的分布式垂直搜索引擎的系统中,高效的海量...
- 刘玮
- 关键词:垂直搜索引擎网络存储分布式存储
- 一种有向复杂网络生成模型的建立方法
- 2018年
- 对于很多网络数据挖掘的应用,如链路预测、朋友推荐、社区发现和网络演化等,理解网络链路的生成模式是重要的基础性工作.随着复杂网络研究的发展,越来越多的网络应用可以抽象为有向网络的形式,但现有的研究大多关注于无向网络的范围,有向网络的生成机制亟待深入研究.通过分析有向网络的局部结构,基于微观组织模式,提出一种有向复杂网络生成模型的建立方法:局部相关位置方法.同时提出一种对应的链路预测算法来检验生成模型.在各种真实有向网络数据集中的实验结果证明了网络生成模型的有效性.
- 刘大伟杨文峰王海洋刘玮
- 关键词:有向网络网络挖掘链路预测
- 基于统计特征的垃圾博客过滤被引量:6
- 2008年
- 该文根据垃圾博客和正常博客在统计特征上的差异,对多种针对博客分类有效的统计特征进行了分析,提出基于博客页面统计特征的过滤方法。在Blog06数据集上的实验表明,该方法的过滤准确性达到97%,比基于词频特征的过滤方法提高了约7%,在不同规模训练集上的准确性保持在95%左右,具有更好的泛化能力。
- 刘玮廖祥文许洪波王丽宏
- 关键词:计算机应用中文信息处理统计特征泛化能力
- 立场分析研究综述被引量:6
- 2020年
- 随着以微博、Twitter为代表的社交媒体的快速发展,越来越多的用户喜欢在网上浏览热点信息,并发表自己的观点。立场分析旨在挖掘用户对特定目标或主题(例如,事件、产品、政策、人物或者服务等)的支持、反对或者中立的态度,该研究对舆情监管、信息推荐等具有重要意义。该文对立场分析研究开展综述,从立场分析定义,基于机器学习、深度学习及迁移学习的立场分析方法,使用的数据集三方面分别进行概述,并对未来的研究方向进行展望。
- 刘玮彭鑫李超王品王丽宏
- 关键词:立场分析
- 基于内容特征的垃圾博客过滤
- 本文根据垃圾博客和正常博客在内容特征上的差异,对多种针对博客分类有效的统计特征进行了分析,提出基于博客内容统计特征的过滤方法。在Blog06数据集上的实验表明,该方法的过滤准确性达到97%,比基于词频特征的过滤方法提高了...
- 刘玮廖祥文许洪波
- 关键词:统计特征泛化能力
- 文献传递