许志刚
- 作品数:7 被引量:14H指数:1
- 供职机构:北京工业大学更多>>
- 发文基金:国家自然科学基金北京市自然科学基金北京市属高等学校高层次人才引进与培养计划更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 一种基于语义扩充的微博话题检测和热度评估方法
- 一种基于语义扩充的微博话题检测和热度评估方法,属于文本信息处理领域,具体涉及微博噪声数据过滤、基于语义扩充的微博话题检测和话题热度评估方法及系统。本发明首先给出了微博噪声数据过滤方法,用于低信息量微博的过滤,然后将微博评...
- 刘磊许志刚李静
- 文献传递
- 一种基于语义扩充的微博话题检测和热度评估方法
- 一种基于语义扩充的微博话题检测和热度评估方法,属于文本信息处理领域,具体涉及微博噪声数据过滤、基于语义扩充的微博话题检测和话题热度评估方法及系统。本发明首先给出了微博噪声数据过滤方法,用于低信息量微博的过滤,然后将微博评...
- 刘磊许志刚李静
- 基于改进卡方统计的微博特征提取方法被引量:14
- 2014年
- 通过对微博文本特征信息的分析与研究,提出一种基于改进卡方统计的微博特征提取方法。扩充微博信息分类特征,在传统的卡方统计量的基础上,引入了频度等因素,改进特征选择方法;在传统的特征项权值计算的基础上,提出了新的改进卡方统计量的方法,改进权重计算效果。对上述方法利用经典KNN和SVM算法进行了测试,实验结果表明该方法提高了微博信息分类的准确率。
- 徐明高翔许志刚刘磊
- 关键词:权值计算
- 一种基于转发评论的微博语义扩充模型和方法
- 本发明提出了一种微博的语义扩充模型和系统,属于文本信息处理领域,具体涉及微博分类和微博语义扩充方法及系统。本发明是一种基于转发评论的微博语义扩充模型。首先在对微博用户类型分析的基础上将微博分为六种类型:信息发布型微博、日...
- 刘磊许志刚李静
- 文献传递
- 一种基于转发评论的微博语义扩充模型和方法
- 本发明提出了一种微博的语义扩充模型和系统,属于文本信息处理领域,具体涉及微博分类和微博语义扩充方法及系统。本发明是一种基于转发评论的微博语义扩充模型。首先在对微博用户类型分析的基础上将微博分为六种类型:信息发布型微博、日...
- 刘磊许志刚李静
- 文献传递
- 基于转发评论的微博语义扩充和分类方法
- 2015年
- 为了对微博用户、微博文本和微博评论进行分析和研究,提出了一种基于转发评论的微博语义扩充和分类方法.首先在对微博用户类型分析的基础上将微博分为6种类型;然后以信息发布型微博为研究对象,提出了微博评论选择算法,筛选出微博有效评论;再利用基于转发评论的微博语义扩充和分类(comment-based microblog's semantic expansion and classification,CBMSEC)方法,将微博有效评论信息补充进微博语义,改善微博数据稀疏的问题,提高微博的分类性能.
- 刘磊许志刚蔡海博王石
- 微博类短文本语义扩充与热点发现方法研究
- 随着互联网和移动技术的快速发展,微博作为一种新兴的信息交流媒体形式,发展速度很快,影响力日益增强,已经成为人们不可或缺的一种交流沟通、信息传播的手段和媒介。微博信息已成为舆情预警、事件监测、智能系统等领域的重要数据来源,...
- 许志刚
- 关键词:信息处理