谭松波
- 作品数:29 被引量:253H指数:8
- 供职机构:中国科学院计算技术研究所更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术理学文化科学更多>>
- 一种跨领域的文本情感分类器的训练方法和分类方法
- 本发明提供一种跨领域的文本情感分类器的训练方法,包括下列步骤:1)在源领域和新领域样本的关键词中挑选通用情感特征;2)根据源领域的样本,计算特征w<Sub>t</Sub>属于类别c<Sub>k</Sub>的样本的概率P(...
- 谭松波程学旗
- 文本情感倾向性分析方法
- 本发明提供一种文本情感倾向性分析方法,包括下列步骤:1)根据训练文本的标签确定测试文本的初始情感分;2)基于图排序算法利用所述测试文本的初始情感分迭代计算所述测试文本的情感分并进行归一化;3)当所述迭代结束时,根据所述计...
- 吴琼谭松波程学旗
- 文献传递
- 一种基于关键词的文本情感分类器的训练方法和分类方法
- 本发明提供一种基于关键词的文本情感分类器训练方法和分类方法,其中情感分类器训练方法包括下列步骤:1)在旧领域训练集和新领域测试集的文本的关键词中挑选枢纽特征;2)计算描述所述枢纽特征与所述旧领域训练集和新领域测试集的文本...
- 谭松波程学旗
- 文献传递
- 高性能文本分类算法研究
- 因特网上的文本信息的爆炸式增长给文本分类的精度与速度提出了新的标准与挑战。这就要求文本分类在提高精度的同时,还要进一步提升训练与分类速度。为了面对时代的挑战,作者从特征选择与学习算法两个角度展开了深入的研究,取得了一系列...
- 谭松波
- 关键词:特征提取文本分类文本挖掘信息检索
- 文献传递
- 大规模网络内容安全控制关键技术与示范系统研究
- 程学旗王丽宏余翔湛丁国栋熊刚舒敏黄文廷贺龙涛刘峰刘振业王勇王东滨李东何慧董永苹谭松波
- 大规模网络内容安全监控示范应用系统包括安全响应管控平台、信息对抗平台、互联网舆情监测系统等三个应用系统。安全响应管控平台能够在网络舆情暴发时,及时将控管指令在全网生效,并结合空路由技术和路由扩散技术将舆情控制在局部的最小...
- 关键词:
- 基于关键句的多语言情感数据处理分类方法及系统
- 本发明公开了一种基于关键句的多语言情感数据处理分类方法及系统,方法包括:步骤1,从未标注的情感数据集中自动抽取一部情感词典数据包,通过K近邻算法和投票规则来最终判定情感词的极性;步骤2,用抽取出的情感词典数据包计算情感属...
- 程学旗林政张瑾谭松波徐学可
- 文献传递
- 基于中文微博语料的情感倾向性分析被引量:11
- 2014年
- 微博的兴起与传播使得短文本情感分类成为目前的热门研究领域。通过对中文微博语料的情感倾向性分析进行研究,提出了一种新的情感分类方法。首先构建了两级情感词典,并对不同级别情感词作不同增强;然后在情感特征方面使用N-Gram方法,尽量获取有限长度博文中的未登录情感词和情感信息。经实验验证与传统方式相比较,该方法的准确率和召回率都有所提高,在COAE2014微博情感倾向性评测任务中也取得了较好的成绩。
- 罗毅李利谭松波程学旗
- 关键词:情感分类
- 基于情感关键句抽取的情感分类研究被引量:27
- 2012年
- 情感分析需要解决的一个重要问题是判断一篇文档的极性是正面的还是负面的.情感分类的正确率很难达到普通文本分类的水平,因为情感分类更难更复杂.在判断文档的情感极性时,不同的句子具有不同的情感贡献度,所以,对整篇文档的关键句和细节句进行区分将有助于提高情感分类的性能.关键句通常简短且具有判别性,而细节描述句通常复杂多样且容易引入歧义.在关键句抽取算法中,考虑3类属性:情感属性、位置属性和关键词属性.为了更好地利用关键句和细节句之间的差异性和互补性,将抽取的关键句分别用于有监督的和半监督的情感分类.在有监督情感分类中,采用的是分类器融合的方法;在半监督情感分类中,采用的是Co-training算法.在8个领域上进行实验,结果表明所提方法性能明显优于Baseline,从而证明情感关键句抽取算法是有效的.
- 林政谭松波程学旗
- 关键词:情感分类关键句分类器融合有监督学习半监督学习
- 监督学习方法在语气挖掘中的应用研究
- Web 语气挖掘是一项具有较大实用价值的挖掘技术,这种技术对于消费者和商家作出决策都是很有帮助的。该技术的核心主要涉及语气分类问题,即判别一篇网页评论的观点倾向是肯定还是否定。本文主要研究五种常用的监督学习方法在语气挖掘...
- 唐慧丰谭松波程学旗
- 关键词:统计学习方法中文信息处理
- 文献传递
- 贝叶斯垃圾邮件过滤研究
- 本文从文本分类角度研究垃圾邮件过滤问题,介绍朴素贝叶斯算法在垃圾邮件过滤中的应用,在PU1邮件语料上实验贝叶斯算法的性能,得到了较好的效果.并比较特征数量、阈值和语料的预处理层次对结果的影响.
- 潘文锋王斌谭松波
- 关键词:垃圾邮件过滤文本分类贝叶斯阈值语料预处理
- 文献传递