张庆庆
- 作品数:5 被引量:28H指数:4
- 供职机构:西安工程大学管理学院更多>>
- 发文基金:国家自然科学基金陕西省软科学研究计划教育部人文社会科学研究基金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 基于机器学习的中文微博情感分类研究被引量:4
- 2015年
- 在中文微博数据的文本情感分类任务中使用机器学习方法 ,为研究不同的特征集对情感分类准确率的影响,综合了一元词特征、句法特征、微博特征、基于评价对象特征、词典特征用于支持向量机分类器中,通过准确率、召回率、F指数比较分析不同特征组合对于分类性能的影响。所提方法用于微博数据中关于药品二甲双胍的评论文本,实验结果表明,一元词特征对文本情感分类的准确率高于其他单类特征,而在与句法特征、微博特征、基于评价对象特征、词典特征的综合使用得到了最高的分类精度。
- 张庆庆刘西林
- 关键词:情感分类
- 基于BPSO随机子空间的文本情感分类研究被引量:4
- 2017年
- 【目的】针对基于机器学习的文本情感分类研究中的文本特征表示向量高维性问题,提出BPSO与随机子空间方法结合的选择性集成算法。【方法】在分析BPSO与随机子空间原理的基础上给出BPSO随机子空间的模型框架及算法流程。将中文评论语料进行特征化表示后,使用BPSO随机子空间进行实验验证和分析。【结果】通过改变随机子空间中子空间率的取值,研究标准随机子空间与BPSO随机子空间选择性集成对分类准确率和系统差异度的影响,结果表明BPSO随机子空间无论在分类准确率还是在系统差异度上均高于标准随机子空间。【局限】尚未在英文数据上进行验证。【结论】将BPSO应用于随机子空间方法构成一种新颖的选择性集成模型,不仅解决了特征向量空间高维性的问题,而且提高了分类的准确率和泛化能力,为中文文本情感分类提供了有效的方法。
- 张庆庆刘西林
- 关键词:随机子空间BPSO文本情感分类
- 基于深度信念网络的文本情感分类研究被引量:9
- 2016年
- 为了提高文本情感分类精度,本文建立了基于深度学习的文本情感分类模型。在模型中通过从文本中提取一元词特征、句法特征、基于依存关系的特征和基于词典的特征构成向量空间,利用信息增益理论进行特征选择,并将提取后特征作为深度信念网络的输入,经过无监督的玻尔兹曼机预训练和有监督的后向传播算法对网络进行微调后得到分类结果。以中文酒店评论数据为语料进行了实例计算,结果表明模型中深度信念网络比传统方法能进一步提高中文情感分类的精度。
- 张庆庆刘西林
- 关键词:情感分析文本分类
- 基于依存句法关系的文本情感分类研究被引量:8
- 2015年
- 为增加向量空间模型的文本语义信息,提出三元组依存关系特征构建方法,将此方法用于文本情感分类任务中。三元组依存关系特征构建方法在得到完整依存解析树的基础上,先依据中文语法特点,制定相应规则对原有完整树进行冗余结点的合并和删除;再将保留的依存树转化为三元组关系并一般化后作为向量空间模型特征项。为了验证此种特征表示方法的有效性,构造出在一元词基础上添加句法特征、简单依存关系特征和词典得分不同组合下的特征向量空间。将三元组依存关系特征向量与构造出的不同组合特征向量分别用于支持向量机和深度信念网络中。结果表明,三元组依存关系文本表示方法在分类精度上均高于其他特征组合表示方法,进一步说明三元组依存关系特征能更充分表达文本语义信息。
- 张庆庆刘西林
- 关键词:文本情感分类向量空间模型
- 基于深度信念网络的文本情感分类研究被引量:3
- 2019年
- 【目的】将深度信念网络应用于中文文本情感分类,系统研究深度信念网络在文本情感分类任务中的参数选择与性能分析。【方法】以中文电子商务网站评论数据为研究对象,提取一元词、二元词、词性、简单依存关系、情感得分和三元组依存关系特征作为深度信念网络的输入,通过设置不同网络深度、不同输入维数的网络结构计算分类准确率。【结果】实验结果表明,三元组依存关系特征作为深度信念网络的输入分类效果更好,而网络层数对分类准确率的影响不大。【局限】尚未在其他深度学习模型上进行实验验证。【结论】深度学习在文本情感分类任务中性能良好,验证了深度学习对复杂任务有很强的学习能力,但其模型选择和参数设置尚需要进一步的研究。
- 张庆庆贺兴时王慧敏蒙胜军