杨玉珍
- 作品数:12 被引量:81H指数:6
- 供职机构:菏泽学院计算机与信息工程系更多>>
- 发文基金:国家自然科学基金山东省自然科学基金国家社会科学基金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 应用特征项分布信息的信息增益改进方法研究被引量:14
- 2009年
- 在特征项分布不平衡的情况下,传统信息增益算法的分类性能会急剧下降,针对此缺陷提出了一种利用特征项分布信息来改进信息增益公式的计算方法。通过计算特征项分布信息来判定特征项是否存在不平衡性,并利用此信息来平衡特征项不出现时对分类精度的影响。通过实验验证,改进后的计算方法整体上比传统的信息增益算法具有更好的性能。
- 杨玉珍刘培玉朱振方邱烨
- 关键词:信息增益类内离散度
- 一种多层次的垃圾邮件智能过滤方法
- 本发明公开了一种多层次的垃圾邮件智能过滤方法,该方法利用特征项的分布信息改进了传统的信息增益算法,减小了系统训练过程中对数据的依赖,从而提高了系统对邮件内容的分析能力;降低了正常邮件的误判率,解决了邮件内容语义信息丢失的...
- 刘培玉朱振方杨玉珍
- 文献传递
- 融合用户情感的在线突发事件识别研究被引量:12
- 2015年
- 文章在研究突发事件网络舆情传播规律的基础上,研究事件特征抽取方法和情感特征的突发性,用于识别突发事件,为预测事件发展提供数据支持。
- 尉永清杨玉珍费绍栋朱振方
- 关键词:突发事件情感特征
- 融合情感过滤的突发事件检测方法被引量:6
- 2015年
- 针对微博等自媒体平台中,突发事件存在的突发性、多爆发点,给突发事件检测带来困难,提出一种整合用户情感过滤的突发事件检测方法。该方法首先将话题映射为层次模型,以时序驱动的方式动态调整模型特征,探测信息新话题。以此为基础分析用户对该话题所持有的情感态度,依据用户的情感态度将话题划分为正面和负面情感倾向两类,并将饱含负面情感倾向的话题视为突发话题。实验证明,无论是准确率还是查全率所提方法均比baseline提高约10%以上。
- 费绍栋杨玉珍刘培玉王健
- 关键词:情感倾向情感过滤自然语言处理
- 向量空间模型中结合句法的文本表示研究被引量:6
- 2011年
- 为增强向量空间模型(VSM)中项的语义描述性,克服VSM中各语义单元相互独立的缺陷,提出一种基于短语的特征粒度描述方法。该方法从文本的表示及特征项之间的组织方式入手,通过句法规则识别基本短语,构建特征与中心动词的关系树,利用基本短语代替BOW中的词。实验结果表明,采用基本短语的文本表示可提高分类的性能,增加项之间的联系,克服特征项相互独立的缺陷,在特征数量较少的情况下仍能保持良好的分类效果。
- 杨玉珍刘培玉姜沛佩
- 关键词:短语句法规则关系树文本表示
- 自媒体环境下突发事件网络舆情应急策略研究被引量:17
- 2015年
- 自媒体平台中信息呈碎片化传播,网民社会情绪具有群极性、盲目性等特征,成为突发事件网络舆情的传播和爆发温床。文章分析了自媒体平台中突发事件网络舆情产生的动力因素、突发事件网络舆情的特征,分别从网络舆情研判和预警、突发事件处置和善后三方面提出应对策略。
- 尉永清杨玉珍朱振方任敏
- 关键词:突发事件网络舆情自媒体
- 融合扩展信息瓶颈理论的话题关联检测方法研究被引量:4
- 2014年
- 话题关联检测的关键任务在于判断给定报道对是否属于同一话题.现有判断方法往往忽略种子事件与其直接相关事件之间的层次关系.为此,通过分析报道内部语义分布规律及篇章结构,并依据语义分布规则,利用语义分布规律改进信息瓶颈(Information bottleneck,IB)算法,用于子话题逻辑语义单元的划分,并利用这些逻辑语义单元表示报道,进行话题关联检测.实验证明该方法有较快的收敛速度,并在一定程度上提高了系统性能.
- 杨玉珍刘培玉费绍栋张成功
- 关键词:信息瓶颈
- 基于潜在狄利克雷分布模型的多文档情感摘要被引量:9
- 2014年
- 针对当前方法难以获取评论文本全局情感倾向性的问题,提出一种基于潜在狄利克雷分布(LDA)模型的多文档情感摘要方法。该方法首先对给定的句子进行情感分析,抽取带有主观性评价的句子;然后,应用LDA模型表示已抽取的句子,并通过词汇的重要度和句子的特征计算句子的权重;最终提取情感文摘。实验结果表明,该方法能够有效地识别情感关键句,在准确率、召回率和F值上均有不错的效果。
- 荀静刘培玉杨玉珍张艳辉
- 关键词:情感分析多文档摘要
- 一种改进的基于遗传禁忌优化的NB算法被引量:2
- 2010年
- 针对传统朴素贝叶斯分类模型应用过程中存在的特征项冗余问题,使用遗传禁忌算法对特征项集进行优化,并在此优化结果的基础上,提出了一种改进的朴素贝叶斯分类方法来解决用户模板中存在的单类别词汇问题。经实验证明,该方法比传统的朴素贝叶斯分类模型具有更好的鲁棒性和分类性能。
- 姜沛佩刘培玉杨玉珍
- 关键词:文本分类遗传算法禁忌算法朴素贝叶斯
- 基于统计与规则的特征权重计算方法研究与应用
- 随着信息技术的飞速发展,互联网的普及,宽带移动通信带来的高速移动无线传输以及“云计算”催生的新的数据存储方式,物联网端到端的传输等新技术变革,均把人类推向了一个信息极大丰富的时代。然而,面对浩如烟海的电子信息,人们却又显...
- 杨玉珍
- 关键词:网络信息过滤信息增益句法规则