您的位置: 专家智库 > >

王伟

作品数:4 被引量:27H指数:3
供职机构:广东外语外贸大学思科信息学院更多>>
发文基金:国家社会科学基金广东省哲学社会科学“十二五”规划项目教育部“新世纪优秀人才支持计划”更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 4篇中文期刊文章

领域

  • 4篇自动化与计算...

主题

  • 3篇情感
  • 1篇短文
  • 1篇新闻
  • 1篇新闻评论
  • 1篇演进
  • 1篇演进分析
  • 1篇数据稀疏
  • 1篇潜在主题
  • 1篇情感分类
  • 1篇情感分析
  • 1篇情感倾向
  • 1篇种子
  • 1篇文本
  • 1篇文本情感
  • 1篇向量
  • 1篇聚类
  • 1篇聚类算法
  • 1篇本情
  • 1篇PLSA
  • 1篇LDA

机构

  • 4篇广东外语外贸...

作者

  • 4篇林江豪
  • 4篇阳爱民
  • 4篇周咏梅
  • 4篇王伟
  • 1篇周剑峰
  • 1篇方泽锋
  • 1篇曾文俊

传媒

  • 2篇数据采集与处...
  • 1篇计算机工程与...
  • 1篇小型微型计算...

年份

  • 2篇2017
  • 2篇2016
4 条 记 录,以下是 1-4
排序方式:
基于种子词的微博表情符情感倾向判定方法被引量:5
2017年
情感倾向明显的表情符,容易通过人工进行标注。但是对于情感倾向不明显的表情符,多人手工的标注结果往往难以达成一致。因此,提出一种利用种子词自动判定表情符情感倾向的方法。该方法利用少量种子表情符自动标注情感倾向比较明显的表情符,生成表情符标注集;对于情感倾向不明显的表情符,利用种子情感词和已得到的表情符标注集构建模型,实现其情感倾向的自动判定。实验结果表明,本文方法在微博表情符情感倾向的自动判定上有很好的效果。
王伟周咏梅阳爱民林江豪陈昱宏曾文俊
关键词:情感分类
结合词向量和聚类算法的新闻评论话题演进分析被引量:13
2016年
话题演进分析主要是挖掘话题内容随着时间流的演进情况。话题的内容可用关键词来表示。利用word2vec对75万篇新闻和微博文本进行训练,得到词向量模型。将文本流处理后输入模型,获得时间序列下所有词汇的词向量,利用K-means对词向量进行聚类,从而实现话题关键词的抽取。实验对比了基于PLSA和LDA主题模型下的话题抽取效果,发现本文的话题分析效果优于主题模型的方法。同时,采集足够大量、内容足够丰富的语料,可训练得到泛化能力比较强的模型,有利于实时话题演进分析研究工作。
林江豪周咏梅阳爱民王伟
关键词:PLSALDA
一种基于特征簇的微博短文本情感分类方法被引量:2
2016年
针对由微博短文本特征规模大、自身特征较少等特点导致的数据稀疏性,提出一种基于特征簇的微博情感分类方法.提出的分类方法以大规模语料库为基础,利用word2vec模型学习词语之间潜在的语义关联,将单个词语表示成多维向量的形式;结合情感词典,提取出微博文本的情感特征集,在基于词向量计算词语相似度方法的基础上,将情感特征合并为特征簇,以此构造低维的文本向量;最后利用机器学习算法,构建情感分类器,实现微博短文本的情感分类.实验结果表明,本文提出的方法对情感特征的降维是可行和有效的,并且取得很好的情感分类效果.
周咏梅王伟阳爱民林江豪方泽锋
关键词:数据稀疏
一种基于LDA主题模型的评论文本情感分类方法被引量:7
2017年
针对互联网出现的评论文本情感分析,引入潜在狄利克雷分布(Latent Dirichlet allocation,LDA)模型,提出一种分类方法。该分类方法结合情感词典,依据指定的情感单元搭配模式,提取情感信息,包括情感词和上、下文。使用主题模型发掘情感信息中的关键特征,并融入到情感向量空间中。最后利用机器学习分类算法,实现中文评论文本的情感分类。实验结果表明,提出的方法有效降低了特征向量的维度,并且在文本情感分类上有很好的效果。
王伟周咏梅阳爱民周剑峰林江豪
关键词:潜在主题情感分析
共1页<1>
聚类工具0