郭嘉丰
- 作品数:141 被引量:1,055H指数:10
- 供职机构:中国科学院计算技术研究所更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学理学电子电信更多>>
- 一种去中心化的数据交易平台
- 本发明提供了一种去中心化的数据交易平台,包括:元数据管理模块,被配置为:获取卖方待售的数据对应的元数据以及数据对应的加密数据,所述元数据包括数据描述信息和卖方地址;数据查重模块,被配置为:根据所述数据对应的加密数据以及已...
- 郭嘉丰于雷廖华明程学旗
- 因果机器学习的前沿进展综述被引量:17
- 2023年
- 机器学习是实现人工智能的重要技术手段之一,在计算机视觉、自然语言处理、搜索引擎与推荐系统等领域有着重要应用.现有的机器学习方法往往注重数据中的相关关系而忽视其中的因果关系,而随着应用需求的提高,其弊端也逐渐开始显现,在可解释性、可迁移性、鲁棒性和公平性等方面面临一系列亟待解决的问题.为了解决这些问题,研究者们开始重新审视因果关系建模的必要性,相关方法也成为近期的研究热点之一.在此对近年来在机器学习领域中应用因果技术和思想解决实际问题的工作进行整理和总结,梳理出这一新兴研究方向的发展脉络.首先对与机器学习紧密相关的因果理论做简要介绍;然后以机器学习中的不同问题需求为划分依据对各工作进行分类介绍,从求解思路和技术手段的视角阐释其区别与联系;最后对因果机器学习的现状进行总结,并对未来发展趋势做出预测和展望.
- 李家宁熊睿彬兰艳艳庞亮郭嘉丰程学旗
- 关键词:因果关系因果推断人工智能
- 一种图像分类模型的训练方法、图像分类方法
- 本发明实施例提供了一种图像分类模型训练方法,该方法包括:S1、获取包括多个图像样本的原始图像数据集及其对应的特征矩阵;S2、对原始图像数据集对应的特征矩阵进行降维处理,并将降维处理后的特征矩阵进行高斯建模以获得特征矩阵中...
- 程学旗李琳郭嘉丰廖华明邱强
- 基于转移学习的命名实体挖掘技术被引量:3
- 2011年
- 研究了针对大规模查询日志中丰富的命名实体的挖掘技术,通过利用Wikipedia数据,结合转移学习方法构建目标类别的分类器.该技术很好地利用了监督学习的优越性能以提高查询日志中命名实体挖掘的准确性,同时也解决了监督学习方法中大规模标注的问题.实验结果表明,基于转移学习的命名实体挖掘技术具有优越的命名实体挖掘性能.
- 翟海军郭勇郭嘉丰程学旗
- 面向多阶段匹配的答案选择模型
- 2023年
- 近年来,信息量成倍增长,获取有效信息的代价越来越高,答案选择技术能够为用户直接提供所需的信息,具有革命性的意义。给定问题和候选答案,答案选择任务要求从候选答案中找出与问题最相关的答案。不失一般性,候选答案根据与问题的匹配程度可以分为三种类型:不相关、相关不合理、相关且合理。然而,已有工作仅考虑问题与答案的相关性,这对于精准问答是远远不够的。为此,提出多阶段匹配模型(MSMM),模拟人的答题过程。具体的,MSMM模型分为两个阶段,第一阶段先将简单易解决的问答对分离出去,第二阶段再综合推理复杂的问答数据。每一阶段都由嵌入层、编码层、对齐层、融合层和池化层组成。此外,为了增强模型的推理能力,还引入语义角色标注信息和单词相似矩阵信息。为了便于评估,基于WikiQA和InsuranceQA数据集构造了两个答案合理性数据集。实验结果表明,对比基准方法,该模型在性能上取得一致的提升。
- 陈建贵张儒清郭嘉丰范意兴
- 关键词:问答系统
- 知识库问答系统中的实体链接方法
- 本发明提供一种知识库问答系统中的实体链接方法,包括:从问句中获取主题词集合;根据获取的主题词集合在知识库中进行搜索,得到初步候选实体集合;对于所述初步候选实体集合中的每个实体,从该实体、所述问句以及所述知识库提取相应的特...
- 程学旗靳小龙席鹏弼郭嘉丰林谢雄曾宇涛
- 文献传递
- 基于吸收态随机行走的两阶段效用性查询推荐方法被引量:3
- 2013年
- 搜索引擎已经成为人们获取信息的重要途径,然而对于用户而言如何构造一个合适的查询仍然是一项困难的工作.为了减轻用户搜索信息的负担,查询推荐技术应运而生并且已经成为当今搜索引擎不可或缺的组成部分.传统的查询推荐方法主要关注向用户推荐相关性查询,即推荐与源查询具有相近搜索意图的其他查询.然而查询推荐的根本目标是帮助用户成功完成其搜索任务,而不仅仅是找到相关性查询,尽管相关性查询有时也能得到有用的搜索结果.为了更好地满足用户的搜索目标,一种更直接的查询推荐方式是向用户推荐高效用性查询,即能够更好满足用户信息需求的查询.提出了一个基于吸收态随机行走的2阶段效用性查询推荐方法,该方法能够同时对用户的查询重构行为和查询点击行为进行建模并推导出查询的效用.在真实查询日志上的实验结果表明:新方法在评价指标查询相关率(query relevant ratio,QRR)和平均相关文档数(mean relevant document,MRD)上要显著优于其他5种基准方法.
- 朱小飞郭嘉丰程学旗兰艳艳
- 关键词:查询推荐查询日志效用性
- 一种用于显性代词的指代消解方法、系统
- 本发明提供一种用于显性代词的指代消解方法,所述方法包括:S1、获取待处理文本段落并将其拆分为多个分句;S2、判断所述待处理文本段落是否存在指代现象,存在指代现象时,将存在照应语的分句作为一个当前文本,以及选择每一个当前文...
- 郭嘉丰徐辉程学旗范意兴
- 一种字符串散列表实现方法和系统
- 本发明涉及一种字符串散列表实现方法,包括:根据字符串长度,将该字符串分发至对应的散列表;其中,该散列表包括数组散列表、数值型散列表和字符型双散列表。本发明使用多种异构散列表存储字符串,针对不同字符串的长度选择合适的散列表...
- 郑天祺程学旗李冰王征张志斌刘悦赵鹏郭嘉丰
- 文献传递
- 基于弱监督预训练深度模型的微博情感分析被引量:5
- 2017年
- 微博情感分析对于商业事务和政治选举等应用非常重要。传统的做法主要基于浅层机器学习模型,对人工提取的特征有较大的依赖,而微博情感特征往往难以提取。深度学习可以自动学习层次化的特征,并被用于解决情感分析问题。随着新的深度学习技术的提出,人们发现只要提供足够多的监督数据,就能训练出好的深度模型。然而,在微博情感分析中,通常监督数据都非常少。微博中广泛存在着弱监督数据。该文提出基于弱监督数据的"预训练—微调整"训练框架(distant pretrain-finetune),使用弱监督数据对深度模型进行预训练,然后使用监督数据进行微调整。这种做法的好处是可以利用弱监督数据学习到一个初始的模型,然后利用监督数据来进一步改善模型并克服弱监督数据存在的一些问题。我们在新浪微博数据上进行的实验表明,这种做法可以在监督数据较少的情况下使用深度学习,并取得比浅层模型更好的效果。
- 万圣贤兰艳艳郭嘉丰程学旗
- 关键词:情感分析