张虎
- 作品数:103 被引量:160H指数:7
- 供职机构:山西大学计算机与信息技术学院更多>>
- 发文基金:国家自然科学基金山西省自然科学基金国家社会科学基金更多>>
- 相关领域:自动化与计算机技术文化科学电子电信理学更多>>
- 一种融合语义场景的摘要自动生成方法及系统
- 本发明属于自然语言处理研究领域,具体为一种融合语义场景的摘要自动生成方法及系统。具体内容如下:一、图构建单元,根据文章中的框架分别构建语义场景图和词关系图;二、文章编码单元,使用预训练模型获取文章的向量表示;三、图编码单...
- 关勇李茹郭少茹谭红叶张虎
- 文献传递
- 一种汉语自监督词义理解方法及系统
- 本发明公开了一种汉语自监督词义理解方法及系统,属于自然语言处理技术领域。通过生成式自监督与判别式自监督两种方式,提高模型对词语具体含义识别的准确性。生成式方式即设计面向词义理解的预训练任务,提升模型对文本中歧义词表示的能...
- 谭红叶金旭李茹张虎
- 规则与统计相结合的分词一致性检验被引量:7
- 2008年
- 建设高质量的大规模语料库是中文信息处理领域的基础性工程,保证语料库分词结果的一致性是衡量语料库分词质量的重要标准之一。在分析了大量的语料库切分不一致现象后,提出了规则与统计相结合的分词一致性检验的新方法。与以往单一的处理方法相比,该方法更具针对性的对语料库中存在的各种不同的分词不一致现象分别进行处理,能够更加有效的解决分词不一致问题,进一步保证语料库的质量。
- 刘博郑家恒张虎
- 关键词:中文信息处理大规模语料库分词语料库加工
- 一种基于可解释因果模型的司法判决推理方法
- 本发明涉及机器学习、自然语言处理、因果推理等领域,具体涉及一种基于可解释因果模型的司法判决推理方法。包括分析与表示司法数据、定义司法判决推理框架、构建司法判决推理因果模型。其中定义司法判决推理框架包括:提取事实要素、认定...
- 张虎王鑫杨陟卓李茹谭红叶
- 文献传递
- 一种基于多层知识感知的地址实体识别方法
- 本发明属于自然语言处理领域,具体涉及一种基于多层知识感知的地址实体识别方法。本方法结合地址实体识别在知识图谱构建过程中需要面对的应用场景,设计并提供了基于多层知识感知的地址实体识别方法,从地址实体识别的角度出发,依据地址...
- 李茹高俊杰邵文远谭红叶张虎闫智超苏雪峰张越梁吉业
- 阅读理解中因果关系类选项的研究被引量:3
- 2018年
- 针对阅读理解选择题中因果关系类选项,该文提出了基于因果关系网的因果关系支持度分析方法。首先,通过线索短语从阅读材料中抽取因果事件对,并计算事件对之间因果关联强度,综合利用抽取到的因果事件对与其对应的因果关联强度构成因果关系网;其次,综合考虑了选项中的每个词在文档中的重要性和整个文档中的区分能力,采用词频一逆向文件频率(term frequency-inverse document frequency,TF—IDF)方法分别从原文中检索与选项中因事件和果事件相关的句子;最后,基于因果关系网和抽取到的相关句计算选项的因果关系支持度。为了验证该方法,实验采用了769篇模拟材料和13篇北京高考语文试卷材料(包括原文与选择题)作为测试数据集,实验结果表明该方法的准确率比Baseline方法提高了约11%。
- 王元龙李茹张虎王智强
- 关键词:自然语言处理语义相似度
- 内容增强与时间匹配的兴趣点推荐方法被引量:3
- 2020年
- 针对目前兴趣点推荐对影响用户签到决策因素的全面分析不足,很少将评论情感识别与时间因素分析同时融入推荐框架等问题,探索一种兴趣点推荐的改进方法。在分析地理位置与社交关系对用户签到行为影响的基础上,将评论内容与签到时间两个因素同时融入到推荐中,集成兴趣点的类别与流行度信息。使用自然语言处理技术挖掘评论文本的情感倾向,用于调整用户签到偏好估计;通过建模用户活动时间规律与兴趣点时间流行度,将时间因素融入推荐模型,向用户推荐Top-N兴趣点。基于Foursquare真实签到数据集的对比实验结果表明,与目前主流方法相比,该模型在精确率和召回率上均有明显提升。
- 陈炯张虎
- 关键词:情感倾向社交关系
- 面向生成式文本摘要的多粒度对比暹罗网络模型及方法
- 本发明涉及深度学习、自然语言处理等领域,具体涉及一种面向生成式文本摘要的多粒度对比暹罗网络模型及方法。本发明模型包括多粒度数据增强模块、自监督对比学习模块、摘要生成模块和联合学习模块。基于上述模型,本发明将字词级噪声和句...
- 张虎李坤睿王宇杰范越张广军李茹
- 一种语义场景一致性识别阅读机器人
- 本发明属于自然语言处理研究领域,具体涉及一种语义场景一致性识别阅读机器人。包括语义场景构建单元、语义场景层次化表示单元、语义场景关系交互单元和语义场景一致性识别单元;本发明能够应用于阅读机器人,通过自动分析、推理,自动识...
- 郭少茹李茹关勇谭红叶段菲张虎
- 文献传递
- 基于CFN和篇章主题的概括型问答题的解答被引量:3
- 2020年
- 相对于普通阅读理解,高考语文阅读理解难度更大,问句更加抽象,答案候选句的抽取除了注重与问句的相似性分析,还注重对材料内容以及作者的观点的概括归纳。因此该文提出了利用汉语框架网(Chinese FrameNet)抽取与问句语义相似的候选句的方法,通过识别篇章主题(段落主题句和作者观点句),生成与问句相关的内容要点以及作者的观点态度,最终选取top 6作为答案句。在近12年北京市高考真题上进行测试,召回率达到了68.69%,验证了该方法的有效性。
- 杨陟卓李春转张虎钱揖丽李茹
- 关键词:框架语义