公共文化服务平台

王连喜: 作品数：32 被引量：383H指数：11; 供职机构：广东外语外贸大学图书馆更多>>; 发文基金：国家自然科学基金教育部人文社会科学研究基金广东省科技计划工业攻关项目更多>>; 相关领域：自动化与计算机技术文化科学经济管理理学更多>>

合作作者

面向企业微博的客户细分框架被引量：1: 2016年; 【目的】为有效解决微博客户特性的表示问题,以更好地实施企业微博客户细分。【方法】借助微博平台上客户的个人和社会关系特性,利用客户及其好友的自定义标签表示客户的特性,采用基于非负矩阵分解的文本聚类方法,提出一种面向企业微博的客户细分框架。【结果】实验结果表明,基于非负矩阵分解的方法取得约86.130%的asw指标平均值,远远超出基于K-means和层次聚类的方法。【局限】只通过融合微博客户个人及其关注好友的标签表示微博客户特性的方法不能够全面刻画客户特征。【结论】能够为企业微博客户细分中的客户特性的表示、细分、评价及结果可视化等问题提供参考和借鉴。; 陈东沂周子程蒋盛益王连喜吴佳林; 关键词：客户细分文本聚类非负矩阵分解

知识发现系统的相关性排序与主题聚类功能问题探析被引量：4: 2015年; 文章以Primo、EDS和Summon 3种较为常用的发现系统为分析对象,总结发现系统检索结果的相关性排序与主题聚类功能的基本原理和特点,进而就检索结果在相关性排序及主题聚类功能拓展方面所面临的用户满意度提升问题、主题聚类数量划分问题、多语言检索排序问题,以及资源的智能化推荐问题展开讨论,并针对存在的问题提出解决思路。; 王连喜; 关键词：知识发现系统主题聚类多语言 PRIMO EDS SUMMON

基于特征相关性的特征选择被引量：16: 2010年; 提出了一种基于特征相关性的特征选择方法。该方法以特征之间相互依赖程度(相关度)为聚类依据先对特征进行聚类,再从各特征簇中挑选出具有代表性的特征,然后在被选择出来的特征中删除与目标特征无关或是弱相关的特征,最后留下的特征作为最终的特征子集。理论分析表明该方法的运算效率高,时间复杂度低,适合于大规模数据集中的特征选择。在UCI数据集上与文献中的经典方法进行实验比较和分析,结果显示提出的特征选择方法在特征约减和分类等方面具有更好的性能。; 蒋盛益王连喜; 关键词：相关度特征聚类

国内外知识组织研究内容与发展——基于《图书情报工作》与Knowledge Organization期刊论文的比较分析被引量：4: 2017年; 知识组织一直是图书情报学领域的重要课题,相关研究也在不断突破与发展以实现知识的有效查询与获取。本文以《图书情报工作》和Knowledge Organization(《知识组织》)2009—2016年期刊论文为研究对象,运用文献计量分析和比较分析的方法,从生产主体、知识基础、研究主题三个角度对比分析了国内外知识组织领域研究现状与进展。研究表明,计算机科学和知识管理是国内知识组织研究重要的学科基础,对应着技术导向和管理导向两种研究路径;国外则十分关注传统知识组织的内容及其在不同语种、领域和资源类型等新环境中的应用,且非常重视从社会文化与哲学等抽象层面思考知识组织的本质与基础。本文通过管窥国内外知识组织发展现状及差异,以期能够帮助国内研究者更加清晰地认识与界定知识组织的内涵与范围,更好地把握未来的研究方向。; 曹树金王志红王连喜; 关键词：知识组织研究主题知识基础

国内微博研究热点分析及主题挖掘——以计算机和图书情报学科为研究对象被引量：14: 2015年; 以CNKI数据库中计算机和图书情报学科的核心期刊论文及硕博士学位论文为研究对象,以共词分析法和主题模型为工具,首先从数据集中提取并确定能够反映当前国内关于微博研究的重要关键词,然后采用SPSS的层次聚类法和LDA主题挖掘模型分别对共词矩阵和主题词向量进行定量分析,归纳出国内微博研究的热门知识点和重要主题,并对研究热点和研究主题进行宏观剖析,认为当前国内微博研究主要呈现出用户、内容和应用的三层结构特点。最后通过比较热点分析与主题挖掘的结果发现,国内的主要成果集中在微博内容层面的研究,涉及了情感分析、短文本处理、信息处理技术、主题发现、事件检测和信息挖掘等几个方面。; 王连喜李霞; 关键词：共词分析主题挖掘 LDA

基于二阶段聚类的重叠社区发现算法被引量：3: 2015年; 针对当前复杂网络重叠社区发现的热点问题,提出基于二阶段聚类的重叠社区发现算法.对网络邻接矩阵进行特征分解时,节点投影到k维欧氏空间后,对节点先后进行硬聚类和软聚类,高效自适应地挖掘网络中的重叠社区结构.在硬聚类阶段中,引入基于距离最小原则的一趟聚类算法对节点进行自适应的硬划分,确定软聚类阶段中的聚类中心和网络的社区数量.在软聚类阶段中,引入以模糊模块度为目标函数的模糊C均值算法,通过迭代优化模糊模块度实现对节点的软划分,挖掘网络中的重叠社区结构.在多个真实网络数据集上的实验验证文中算法能高效挖掘复杂网络中的重叠社区结构.; 蒋盛益杨博泓李敏敏吴美玲王连喜; 关键词：模糊聚类

基于聚类的电信客户细分被引量：4: 2011年; 电信行业是典型的数据密集型行业，拥有大量的甚至是海量的客户数据资源。对电信行业客户消费数据进行深入挖掘可以为企业的资源优化配置和客户关系管理提供理论支持和技术保障。以电信行业的客户消费数据为基本研究对象，在衍生特征构造、样本调整以及特征选择等数据预处理的基础上，本文采用可处理混合数据且具有近似线性时间复杂度的一趟聚类算法建立电信行业的客户细分模型。经实证研究表明，该模型可以将电信的客户有效划分成四个具有不同忠诚程度和消费能力的客户群体，同时从各客户群的消费行为中还可以有效地分析出他们的消费偏向和流失倾向。说明提出的方法是一种有效的客户细分方法。; 王连喜蒋盛益; 关键词：客户细分聚类客户关系管理电信

面向不平衡问题的集成特征选择被引量：5: 2011年; 传统的特征选择方法基本上是以精度为优化目标,没有充分考虑数据样本类别分布倾斜性,在数据分布不平衡的数据集上性能表现不理想。在不平衡数据集上通过有放回的抽样方法独立地从数据集大类样本集中随机抽取多个样本子集,使每次随机抽取的样本数量与小类样本数量一致,然后将各抽取的样本子集分别与小类样本集组合成多个新的训练样本集。对多个新样本集的特征子集以集成学习的方式采用投票机制进行投票,数据集的最终特征子集以得票数目超过半数的特征共同组合而成。在UCI不平衡数据集上的实验结果显示,提出的方法表现出了较好的性能,是一种能够处理不平衡问题的有效特征选择方法。; 李霞王连喜蒋盛益; 关键词：不平衡数据集

一种基于特征聚类的特征选择方法被引量：20: 2015年; 特征选择是数据挖掘和机器学习领域中一种常用的数据预处理技术。在无监督学习环境下,定义了一种特征平均相关度的度量方法,并在此基础上提出了一种基于特征聚类的特征选择方法 FSFC。该方法利用聚类算法在不同子空间中搜索簇群,使具有较强依赖关系(存在冗余性)的特征被划分到同一个簇群中,然后从每一个簇群中挑选具有代表性的子集共同构成特征子集,最终达到去除不相关特征和冗余特征的目的。在UCI数据集上的实验结果表明,FSFC方法与几种经典的有监督特征选择方法具有相当的特征约减效果和分类性能。; 王连喜蒋盛益; 关键词：特征聚类相关度无监督学习

一种基于增量式谱聚类的动态社区自适应发现算法被引量：21: 2015年; 针对当前复杂网络动态社区发现的热点问题,提出一种面向静态网络社区发现的链接相关线性谱聚类算法,并在此基础上提出一种基于增量式谱聚类的动态社区自适应发现算法.动态社区发现算法引入归一化图形拉普拉斯矩阵呈现复杂网络节点之间的关系,采用拉普拉斯本征映射将节点投影到k维欧式空间.为解决离群节点影响谱聚类的效果和启发式确定复杂网络社区数量的问题,利用提出的链接相关线性谱聚类算法发现初始时间片的社区结构,使发现社区的过程能够以较低的时间开销自适应地挖掘复杂网络社区结构.此后,对于后续相邻的时间片,提出的增量式谱聚类算法以前一时间片聚类获得的社区特征为基础,通过调整链接相关线性谱聚类算法实现对后一时间片的增量聚类,以达到自适应地发现复杂网络动态社区的目的.在多个数据集的实验表明,提出的链接相关线性谱聚类算法能够有效地检测出复杂网络中的社区结构以及基于增量式谱聚类的动态社区自适应发现算法能够有效地挖掘网络中动态社区的演化过程.; 蒋盛益杨博泓王连喜; 关键词：谱聚类拉普拉斯矩阵增量聚类

王连喜

合作作者

文献类型

领域

主题

机构

作者

传媒

年份

用户反馈

王连喜

合作作者

文献类型

领域

主题

机构

作者

传媒

年份

用户登录

用户反馈