郑佳
- 作品数:11 被引量:149H指数:6
- 供职机构:北京信息科技大学更多>>
- 发文基金:国家自然科学基金北京市教委科技计划面上项目更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 一种多特征融合的微博用户权威度评价方法
- 本发明公开了一种多特征融合的微博用户权威度评价方法,该方法在新浪微博的用户信息体系的基础上,总结出了用户基本信息完整度、用户传播影响力、用户活跃度以及用户平台指数4项影响用户权威度的特征,并分别给出了提取与计算方法。在用...
- 张仰森郑佳黄改娟
- 一种基于语义关系图的词语语义相关度计算模型被引量:10
- 2018年
- 词语的语义计算是自然语言处理领域的重要问题之一,目前的研究主要集中在词语语义的相似度计算方面,对词语语义的相关度计算方法研究不够.为此,本文提出了一种基于语义词典和语料库相结合的词语语义相关度计算模型.首先,以HowNet和大规模语料库为基础,制定了相关的语义关系提取规则,抽取了大量的语义依存关系;然后,以语义关系三元组为存储形式,构建了语义关系图;最后,采用图论的相关理论,对语义关系图中的语义关系进行处理,设计了一个基于语义关系图的词语语义相关度计算模型.实验结果表明,本文提出的模型在词语语义相关度计算方面具有较好的效果,在Word Similarity-353数据集上的斯皮尔曼等级相关系数达到了0.5358,显著地提升了中文词语语义相关度的计算效果.
- 张仰森郑佳李佳媛
- 关键词:语义相关度HOWNET语义相似度
- 中文文本语义错误侦测方法研究被引量:20
- 2017年
- 中文文本语义错误侦测一直以来都是中文文本自动查错的难点.该文针对中文文本语义错误,提出了一种基于语义搭配知识库和证据理论的语义错误侦测模型.讨论了三层语义搭配知识库的构建以及基于该知识库和证据理论的语义错误侦测算法.三层语义搭配知识库的构建主要分为两步:(1)根据《现代汉语实词搭配词典》中的实词搭配框架构建词语搭配规则集,从训练语料中抽取词语搭配,并利用互信息和共现频次进行筛选,构建词语搭配知识库;(2)利用《HowNet》抽取词语的义原信息,生成词语-义原和义原-义原搭配知识库,并利用聚合度进行二次筛选.在三层语义搭配知识库的基础上,首先对知识库采用自顶向下的搜索模式确定可能错误的语义搭配,然后使用语义搭配的互信息量MI和聚合度PD作为证据,采用统计的方法建立证据信任分配函数,结合证据的冲突处理和加权分配D-S规则进行不确定性推理,获取词语的语义搭配关联强度,以判定是否存在语义错误.实验结果显示,该文所提出的查错模型和算法的F-Score值比其他文献中的最好值提高了14.02%.
- 张仰森郑佳
- 关键词:D-S理论语义搭配自然语言处理社会媒体
- 基于多特征融合的微博用户权威度定量评价方法被引量:16
- 2017年
- 微博用户权威度是评价微博信息可靠性的重要因素之一.本文针对微博用户权威度的定量计算提出了一种基于多特征融合的微博用户权威度定量评价模型.首先,提出了用户权威度的概念,将其定义为用户影响力和被信服度两部分组成;在暂不考虑用户领域影响因子的情况下,基于新浪微博数据,抽取出微博用户信息传播影响力、用户信息完整度、用户活跃度以及用户平台认证指数4项评价特征,以构建了用户权威度定量计算模型;然后,采用层次分析法对所构建模型的4项评价特征的权值进行确定,并分别给出了4项评价特征的提取算法.同时,在用户关注关系网络的基础上,提出了一种基于用户被关注价值的用户信息传播影响力模型UIRank,并通过实验验证了其比PageRank算法更加有效.实验结果表明,本文提出的微博用户权威度定量计算模型比较合理,为用户权威度的定量评价提供了一种可行的解决方案.
- 张仰森郑佳唐安杰
- 关键词:层次分析法
- 基于评论异常度的新浪微博谣言识别方法被引量:10
- 2020年
- 以微博为代表的社交媒体在为公众提供信息共享平台的同时,也为谣言提供了可乘之机.开展微博中谣言的识别和清理方法研究,对维护社会的安全稳定有着重要的现实意义.本文针对新浪微博平台中谣言识别的问题,提出了一种基于评论异常度的微博谣言识别方法.首先采用D-S理论实现微博评论异常度的计算方法;然后利用评论异常度与微博的内容特征、传播特征、用户特征对微博进行抽象表示;最后再利用SVM(Support vector machine)构建一个基于评论异常度的谣言识别模型,实现对新浪微博中谣言微博的识别.实验表明,本文提出的谣言识别模型对新浪微博中谣言识别具有较好的效果,谣言微博识别的F1值达到了96.2%,相较于现有文献的最好结果提高了1.3%.
- 张仰森彭媛媛段宇翔郑佳尤建清
- 关键词:D-S理论SVM
- 一种多特征融合的微博用户权威度评价方法
- 本发明公开了一种多特征融合的微博用户权威度评价方法,该方法在新浪微博的用户信息体系的基础上,总结出了用户基本信息完整度、用户传播影响力、用户活跃度以及用户平台指数4项影响用户权威度的特征,并分别给出了提取与计算方法。在用...
- 张仰森郑佳黄改娟
- 文献传递
- 基于双重注意力模型的微博情感分析方法
- 注意力模型在许多自然语言处理任务中都表现出了优秀的性能.该文针对现有大多数情感分析方法将深度学习模型与情感符号相剥离的现状,提出了一种双重注意力模型的微博情感分析方法.该方法首先利用现有的情感知识库构建了一个包含情感词、...
- 郑佳张仰森黄改娟蒋玉茹
- 关键词:情感分析语义表示情感符号
- 面向社会安全事件的公众情感倾向分析研究
- 以微博为代表的社交媒体已经发展成为一种新的传播媒介,为人们带来了信息获取、发布和传递的便利与自由,彻底改变了人们的信息传播格局和生活模式。但是,社交媒体低成本、用户广、传播快的特点也为社会安全事件的传播和扩散带来了便利,...
- 郑佳
- 关键词:社会安全事件情感分析
- 文献传递
- 一种微博谣言识别方法及系统
- 本发明公开一种微博谣言识别方法和系统,所述方法包括:获取微博文本特征、微博用户特征和微博传播特征;确定微博评论情感倾向、关键词频率和评论数差值;利用证据理论,根据所述微博评论情感倾向、所述关键词频率和所述评论数差值确定微...
- 张仰森彭媛媛郑佳黄改娟
- 文献传递
- 基于双重注意力模型的微博情感分析方法被引量:49
- 2018年
- 微博情感分析是获取微博用户观点的基础。该文针对现有大多数情感分析方法将深度学习模型与情感符号相剥离的现状,提出了一种基于双重注意力模型的微博情感分析方法。该方法利用现有的情感知识库构建了一个包含情感词、程度副词、否定词、微博表情符号和常用网络用语的微博情感符号库;采用双向长短记忆网络模型和全连接网络,分别对微博文本和文本中包含的情感符号进行编码;采用注意力模型分别构建微博文本和情感符号的语义表示,并将两者的语义表示进行融合,以构建微博文本的最终语义表示;基于所构建的语义表示对情感分类模型进行训练。该方法通过将注意力模型和情感符号相结合,有效增强了对微博文本情感语义的捕获能力,提高了微博情感分类的性能。基于自然语言处理与中文计算会议(NLPCC)微博情感测评公共数据集,对所提出的模型进行评测,结果表明:该模型在多个情感分类任务中都取得了最佳效果,相对于已知最好的模型,在2013年的数据集上,宏平均和微平均的F1值分别提升了1.39%和1.26%,在2014年的数据集上,宏平均和微平均的F1值分别提升了2.02%和2.21%。
- 张仰森郑佳黄改娟蒋玉茹
- 关键词:情感分析语义表示情感符号