石林宾
- 作品数:7 被引量:48H指数:3
- 供职机构:昆明理工大学信息工程与自动化学院更多>>
- 发文基金:国家自然科学基金云南省教育厅科学研究基金教育部留学回国人员科研启动基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于半监督主动学习的虚假评论检测被引量:2
- 2015年
- 基于有监督的虚假评论检测方法受限于标注语料的规模,为了更好地利用未标注评论数据来提高分类器的正确率和泛化能力,本文提出一种基于半监督主动学习的虚假评论检测方法.首先,定义并提取评论内容特征以及评论者行为特征,结合这两类特征来对虚假评论进行检测.然后,采用基于熵的主动学习算法选择对学习最有帮助的评论样本,获得其类别标注,将其合并到基于Tri-training的半监督学习算法的训练集中,利用大量未标注评论数据进行学习,提升分类器性能.最后,在领域评论数据集上进行实验,结果表明,将半监督学习与主动学习相结合,能够更有效的利用未标注评论数据,从而有效地提高虚假评论检测的效果.
- 宋海霞严馨余正涛余正涛郭剑毅
- 关键词:半监督学习TRI-TRAINING
- 基于半监督图聚类的项目主题模型构建方法被引量:1
- 2015年
- 项目文档主题表征的好坏直接影响后续评审专家的推荐效果。为有效利用项目文档片段之间的关联关系进行项目主题分析,提出一种基于半监督图聚类的项目主题模型构建方法。该方法首先分析项目文档的结构特点,提取项目名称、项目关键字等能表征主题的结构信息,结合专家证据文档、专家主题关系网等能表征专家主题的外部资源,定义及提取项目文档片段之间的关联关系特征;然后,利用不同类型的关联关系计算项目文档片段之间的相关性,构建项目文档片段间的无向图模型;最后,利用已标记关联关系特征作为聚类的监督信息,采用半监督图聚类算法对项目文档片段进行聚类,从而实现项目主题的提取。项目主题提取对比实验结果验证了所提方法的有效性,项目文档结构化特征、专家证据文档以及专家主题关系网对项目主题模型的构建具有一定的指导作用。
- 石林宾余正涛严馨宋海霞洪旭东
- 关键词:主题模型
- 基于Markov网络的评审专家推荐模型
- 在项目的评审专家推荐过程中,为有效利用主题之间以及专家之间的相关性,本文提出一种基于Markov网络的评审专家推荐模型。该模型首先利用主题之间的相关性以及专家之间的关联关系分别构造主题Markov网络以及专家Markov...
- 高盛祥石林宾余正涛宋海霞严馨
- 关键词:MARKOV网络最大团
- 基于特征映射的微博用户标签兴趣聚类方法被引量:5
- 2015年
- 针对现有的用户兴趣聚类方法没有考虑用户标签之间存在的语义相关性问题,提出了一种基于特征映射的微博用户标签兴趣聚类方法。首先,获取待分析用户及其所关注用户的用户标签,选取出现频数高于设定阈值的标签构建模糊矩阵的特征维;然后,考虑标签之间的语义相关性,利用特征映射的思想将用户标签根据其与特征维标签之间的语义相似度映射到每个特征维下,计算每个特征维所对应的特征值;最后,利用模糊聚类得到了不同阈值下的用户兴趣聚类结果。实验结果表明,本文提出的基于特征映射的微博用户标签兴趣聚类方法有效地改善了用户兴趣聚类效果。
- 秦雨余正涛王炎冰石林宾潘华山
- 关键词:特征映射模糊聚类语义相似度
- 基于自适应聚类的虚假评论检测被引量:33
- 2013年
- 借助评论者的行为特性,提出一种基于评论者行为特征的自适应聚类的虚假评论检测方法.首先,根据评论数据定义自身基本特征以及与其他评论之间的关联性特征,并对每维特征进行归一化处理;其次,根据每一条评论的特征构建聚类矩阵,利用F统计量对K均值算法进行改进,实现评论数据的自适应聚类;最后,计算每个簇偏离整个评论数据集的程度,根据阈值确定异常簇,从而实现虚假评论检测.利用领域评论数据进行实验,结果表明基于自适应聚类的虚假评论检测方法取得了较好的效果.
- 宋海霞严馨余正涛石林宾苏斐
- 关键词:自适应聚类
- 基于主题分析的评审专家推荐方法研究
- 在项目评审过程中,往往需要根据项目的内容以及特点挑选出相关领域的专家,来对项目进行评阅和审查。传统的人工选择评审专家存在耗时、费力以及影响公平性等弊端,因此,自动地为申报项目推荐合适的评审专家是非常必要的。自动地为项目推...
- 石林宾
- 关键词:MARKOV网络协同过滤
- 文献传递