戴丹
- 作品数:4 被引量:5H指数:1
- 供职机构:昆明理工大学信息工程与自动化学院更多>>
- 发文基金:国家自然科学基金国家科技型中小企业技术创新基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 最小费用最大流跨领域情感分类框架被引量:1
- 2017年
- 在对文本的情感极性进行分类的过程中,针对标注训练数据与待判断情感极性的数据来自不同领域,特征分布差异较大,导致传统监督学习方法分类准确率大幅下降的问题,提出基于最小费用最大流框架的跨领域情感分类方法.该方法将跨领域情感分类问题转化为最大化领域间传播信息量和最小化跨领域特征拟合损失量的双重最优化问题,并建立连接源领域和目标领域的费用容量网络,将信息量和损失量分别看作网络中的容量和费用权值,通过最小费用最大流框架解决上述双重最优化问题,调配训练数据特征权值.以更为直观的模型描述领域间的映射关系.实验发现,方法能有效提高跨领域情感分类的准确率.
- 胡杨冯旭鹏戴丹刘利军黄青松
- 关键词:情感分类最小费用最大流
- 基于情感角色模型的文本情感分类方法被引量:3
- 2015年
- 针对传统情感分类方法因情感项指向不明引发的误判和隐藏观点遗漏等问题,提出一种基于评价对象情感角色模型的文本情感分类方法。该方法首先识别文本中的潜在评价对象,通过局部语义分析对潜在评价对象所在语句进行情感标注,确定潜在评价对象所在语句的正负极性,并定义其情感角色;然后,改进特征权值计算方法,将情感角色对应的倾向值融入模型特征空间中;最后,通过特征聚合对特征空间实现模型降维。实验结果表明,所提方法与提取强主观性情感项作为特征的情感分类方法相比,分类准确率约提高3.2%,可有效改善文本情感分类效果。
- 胡杨戴丹刘骊冯旭鹏刘利军黄青松
- 关键词:文本情感分类向量空间模型
- 基于层叠条件随机场的微博热点话题跟踪
- 2016年
- 微博文本的数据稀疏特性,使传统话题跟踪技术只能捕获部分话题微博且准确度不高。同时,在追踪过程中,话题会出现漂移现象。针对以上两个问题,提出一种基于层叠条件随机场的微博热点话题跟踪方法。该方法先通过标识模型标识出可能相关的微博,源热点微博和标识微博分别作为分类模型的观察序列和状态序列来计算相关度分类。其次,通过构造自适应模型对识别模型进行更新且削弱数据稀疏问题,并从相关微博中选取新的观察序列,其余作为新的状态序列进行迭代分类处理。实验表明,该方法比传统方法综合指标F值平均提升4.13%。
- 戴丹胡杨刘骊冯旭鹏刘利军黄青松
- 关键词:层叠条件随机场
- 面向微博可信度评估的辩论图模型被引量:1
- 2017年
- 微博内容具有信息混杂和不确定性等特点,传统可信度判别方法存在一定局限性。因此,该文提出一种面向微博可信度评估的辩论有向图模型,从辩论的角度出发,以图模型直观、形象化地描述了辩论推演过程。通过话题语料构成争议节点,利用争议间的主题情感和潜在逻辑关系定义规则可信度,并设置图中边的权值来代表争议间的防卫和攻击强度。根据相关算法得出结论的可信度,递归进行辩论图演化,得到需判别信息的可信度。实验结果表明该模型比传统方法综合指标值平均提升6%。
- 黄青松戴丹冯旭鹏付晓东刘骊刘利军
- 关键词:辩论有向图