您的位置: 专家智库 > >

庞亮

作品数:17 被引量:96H指数:4
供职机构:中国科学院计算技术研究所更多>>
发文基金:国家自然科学基金国家重点基础研究发展计划西藏自治区科技计划项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 10篇期刊文章
  • 5篇专利

领域

  • 11篇自动化与计算...

主题

  • 4篇文本
  • 3篇神经网
  • 3篇神经网络
  • 2篇网络
  • 2篇媒体
  • 2篇卷积
  • 1篇电子设备
  • 1篇迭代
  • 1篇短时记忆
  • 1篇段落
  • 1篇多跳
  • 1篇信号
  • 1篇信息检索
  • 1篇循环神经网络
  • 1篇因果
  • 1篇因果关系
  • 1篇因果推断
  • 1篇语言处理
  • 1篇语言模型
  • 1篇语义匹配

机构

  • 15篇中国科学院
  • 9篇中国科学院大...
  • 3篇清华大学
  • 1篇教育部
  • 1篇中国人民大学
  • 1篇华为技术有限...
  • 1篇深圳市腾讯计...
  • 1篇山西能源学院

作者

  • 15篇庞亮
  • 12篇程学旗
  • 7篇郭嘉丰
  • 6篇兰艳艳
  • 4篇沈华伟
  • 3篇王永庆
  • 2篇徐君
  • 1篇徐君
  • 1篇徐君
  • 1篇文继荣
  • 1篇靳小龙
  • 1篇董振华
  • 1篇苏立新

传媒

  • 3篇中文信息学报
  • 2篇计算机研究与...
  • 2篇计算机学报
  • 1篇模式识别与人...
  • 1篇山东大学学报...
  • 1篇大数据

年份

  • 2篇2023
  • 7篇2022
  • 1篇2021
  • 3篇2019
  • 2篇2017
17 条 记 录,以下是 1-10
排序方式:
平台经济中的数据与算法安全被引量:9
2022年
人工智能、大数据技术正快速推动着平台经济的发展。互联网平台在以“数据+算法”双轮机制为用户提供个性化、精准化信息服务的同时,也因平台的“生态垄断”、算法的应用不规范等行为对国家网络安全、市场公平竞争和用户合法利益等造成了威胁,给政府监管和平台治理带来了严峻挑战。在此背景下,探讨了平台经济中数据和算法安全的内涵、外延和研究现状,梳理了在保障安全的前提下影响平台创新发展的关键问题,并从体系架构构建、监管体系完善、核心技术突破、平台模式创新4个方面给出了促进平台经济生态创新发展的建议。
郑婷一庞亮靳小龙
关键词:平台经济数据安全
因果机器学习的前沿进展综述被引量:8
2023年
机器学习是实现人工智能的重要技术手段之一,在计算机视觉、自然语言处理、搜索引擎与推荐系统等领域有着重要应用.现有的机器学习方法往往注重数据中的相关关系而忽视其中的因果关系,而随着应用需求的提高,其弊端也逐渐开始显现,在可解释性、可迁移性、鲁棒性和公平性等方面面临一系列亟待解决的问题.为了解决这些问题,研究者们开始重新审视因果关系建模的必要性,相关方法也成为近期的研究热点之一.在此对近年来在机器学习领域中应用因果技术和思想解决实际问题的工作进行整理和总结,梳理出这一新兴研究方向的发展脉络.首先对与机器学习紧密相关的因果理论做简要介绍;然后以机器学习中的不同问题需求为划分依据对各工作进行分类介绍,从求解思路和技术手段的视角阐释其区别与联系;最后对因果机器学习的现状进行总结,并对未来发展趋势做出预测和展望.
李家宁熊睿彬兰艳艳庞亮郭嘉丰程学旗
关键词:因果关系因果推断人工智能
多跳式文本阅读理解方法综述
2022年
多跳阅读理解成为近年来自然语言理解领域的研究热点,与简单阅读理解相比,它更加复杂,需要面对如下挑战:①结合多处内容线索,如多文档阅读等;②具有可解释性,如给出推理路径等。为应对这些挑战,出现了各类不同的工作。因此该文综述了多跳式文本阅读理解这一复杂阅读理解任务,首先给出了多跳文本阅读理解任务的定义;由于推理是多跳阅读理解模型的基础能力,根据推理方式的不同,多跳阅读理解模型可以分为三类:基于结构化推理的多跳阅读理解模型、基于线索抽取的多跳阅读理解模型、基于问题拆分的多跳阅读理解模型,该文接下来比较分析了各类模型在常见多跳阅读理解模型任务数据集上的实验结果,发现这三类模型之间各有优劣。最后探讨了未来的研究方向。
倪艺函兰艳艳庞亮程学旗
一种对社交平台上的媒体账号进行画像的方法和系统
本发明实施例提供了一种对社交平台上的媒体账号进行画像的方法和系统,该方法包括:获取社交平台的账号信息,识别其中符合第一筛选条件的媒体账号以构建第一集合,采集第一集合内的媒体账号的属性数据和历史贴文数据并存储于数据库,第一...
王永庆史铂深沈华伟高金华庞亮程学旗
文献传递
文本内容的衍生方法、装置、计算机可读介质及电子设备
本申请的实施例提供了一种文本内容的衍生方法、装置、计算机可读介质及电子设备。该文本内容的衍生方法包括:获取原始文本内容,基于原始文本内容以及与原始条件相对应的反事实条件,从原始结尾中识别出与原始条件相关的因果内容;基于原...
庞亮郝长盈王琰兰艳艳沈华伟史树明程学旗
文献传递
多段落中文阅读理解模型被引量:1
2019年
解决多段落中文阅读理解任务需要考虑证据段落的稀疏性、中文语义的多样性和答案片段的有效性.基于此种情况,文中设计多段落中文阅读理解模型,利用数据增强的方式学习不包含答案的段落,利用字级别编码和中文词性标注丰富中文的语义表示,通过答案片段的特征训练答案有效性验证模型.将文中模型应用到CIPS-SOGOU事实类问答数据中,实验表明,完全匹配率和F1分数的平均分均有所提高.
赵峻瑶庞亮苏立新兰艳艳郭嘉丰程学旗
基于细粒度匹配信号的文本相关性度量方法和系统
本发明涉及一种基于细粒度匹配信号的文本相关性度量方法和系统,包括:获取待语义匹配的两段文本,将该文本中每一个词映射为词向量,根据其中一段文本中每一个词的词向量,与另一段文本中每一个词向量的语义相似度,将所有该语义相似度集...
程学旗庞亮兰艳艳郭嘉丰沈华伟陈丽娟张海楠曾玮李家宁赵峻瑶倪艺函
文献传递
一种基于社交平台元数据的文本主题建模方法及系统
本发明提出一种基于社交平台元数据的文本主题建模方法和系统,包括基于文本数据的关键词,构建文本数据的词袋表示;基于文本数据的元数据类别,训练对应类别的属性值预测任务,以微调预训练语义提取模型,得到目标语义提取模型,使用目标...
高金华赵鑫沈华伟王永庆庞亮孟剑程学旗
语言模型攻击性的自动评价方法被引量:2
2022年
基于大规模语料训练的语言模型,在文本生成任务上取得了突出性能表现。然而研究发现,这类语言模型在受到扰动时可能会产生攻击性的文本。这种不确定的攻击性给语言模型的研究和实际使用带来了困难,为了避免风险,研究人员不得不选择不公开论文的语言模型。因此,如何自动评价语言模型的攻击性成为一项亟待解决的问题。针对该问题,该文提出了一种语言模型攻击性的自动评估方法。它分为诱导和评估两个阶段。在诱导阶段,基于即插即用可控文本生成技术,利用训练好的文本分类模型提供的梯度方向更新语言模型的激活层参数,增加生成的文本具有攻击性的可能性。在评估阶段,利用训练好的文本分类模型的判别能力,估计诱导产生的攻击性文本的占比,用以评估语言模型的攻击性。实验评估了不同设置下的预训练模型的攻击性水平,结果表明该方法能够自动且有效地评估语言模型的攻击性,并进一步分析了语言模型的攻击性与模型参数规模、训练语料以及前置单词之间的关系。
侯丹阳庞亮丁汉星兰艳艳兰艳艳
关键词:语言模型
基于相关修正的无偏排序学习方法
2022年
用户点击数据较文档的相关标签更易被获取且能反映用户兴趣,将其作为标签能够有效降低人工标注成本并且模型能随数据实时更新.但用户点击含有偏差和噪声,因此需设计有效的无偏排序方法.针对无偏排序中对偶学习方法收敛得到次优解从而无法完全消除偏差的问题,提出一种基于相关修正的无偏排序学习方法.首先,利用现有小规模相关标注数据训练排序模型,对候选文档进行较精准的相关得分预测;再基于用户点击和文档相关得分训练点击倾向模型;最后,将得到的模型参数设为对偶去偏初始值并联合训练.该方法不影响模型上线的计算速度,可用于在线学习场景,模拟不同程度偏差噪声并在真实点击场景下进行测试,结果表明该方案能够有效提升现有无偏排序学习方法表现.
王奕婷兰艳艳庞亮庞亮郭嘉丰
共2页<12>
聚类工具0