国家自然科学基金(61303155)
- 作品数:5 被引量:18H指数:2
- 相关作者:黄敏王丁王颖杨诚朱健鹏更多>>
- 相关机构:中国科学院大学深思考人工智能机器人科技(北京)有限公司中国科学院软件研究所更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术经济管理更多>>
- 基于Map/Reduce并行编程模型的XBRL维度数据解析算法被引量:1
- 2014年
- 从XBRL维度数据处理的角度,研究大规模半结构化数据处理技术,提出一种基于Map/Reduce并行编程模型的XBRL维度数据解析算法.该算法在Map/Reduce编程模型和StAX流式解析技术的基础上,针对XBRL财务报告中各XML文件之间较复杂的数据引用关系,以整份XBRL财务报告为处理的最小单位,结合并行技术提取维度事项所包含的数据,再处理业务语义数据,从而实现复杂XBRL维度数据的解析.性能比较分析表明,该算法在大规模XBRL数据处理方面具有显著优势.
- 朱健鹏王颖杨诚
- 关键词:XBRLMAPREDUCE
- 维度技术在XBRL分类标准中的应用研究被引量:1
- 2015年
- XBRL是应用于会计信息化领域的最新技术,而维度技术是XBRL技术研究的热点和难点之一。本文通过对典型XBRL分类标准的分析研究,针对其应用过程中存在的报表业务内容割裂和冗余元素过多等共性问题,采用XBRL维度技术,提出基于空超立方体实现非维度化基础元素的维度化解决方案和基于空维度去除冗余元素的解决方案,在不改变原有应用方式的基础上,加强了分类标准的业务完整性和实例文档的可验证性。
- 王丁黄敏王颖
- 关键词:XBRL实例文档
- 基于BiDAF多文档重排序的阅读理解模型被引量:4
- 2018年
- 随着互联网的兴起和发展,数据规模急速增长,如何利用机器阅读理解技术对海量的非结构化数据进行解析,从而帮助用户快速、准确地查找到满意答案,是目前自然语言理解领域中的一个热门课题。该文通过对机器阅读理解中的深度神经网络模型进行研究,构建了RBiDAF模型。首先,通过对DuReader数据集进行数据探索,并对数据进行预处理,从中提取出有利于模型训练的特征。其次在BiDAF模型的基础上提出了基于多文档重排序的RBiDAF机器阅读理解模型,该模型在BiDAF模型四层网络框架的基础上添加了ParaRanking层。其中在ParaRanking层,该文提出了多特征融合的ParaRanking算法,此外在答案预测层,提出了基于先验知识的多答案交叉验证算法,进而对答案进行综合预测。在"2018机器阅读理解技术竞赛"的最终评测中,该模型表现出了不错的效果。
- 杨志明时迎成王泳潘昊杰毛金涛
- 基于双通道卷积神经网络的问句意图分类研究被引量:11
- 2019年
- 人机对话技术近年来受到学术界和工业界的广泛关注。人机对话系统的一个关键任务就是如何让聊天机器人理解用户的问句意图并将用户的输入正确地分类到相应领域中,其性能直接影响到特定领域的人机对话质量。该文针对对话问句具有句子长度短、局部特征明显等特点,单通道卷积神经网络(Convolutional Neural Network,CNN)视角单一,不能充分学习到问句的特征信息和语义信息。该文在研究和分析了CNN算法的基础上,提出了意图分类双通道卷积神经网(Intent Classification Dual-channel Convolutional Neural Networks,ICDCNN)算法。该方法首先采用Word2Vec工具和Embedding层进行训练词向量提取问句中的语义信息特征;然后采用两个不同的通道进行卷积运算,一个通道传入字级别的词向量,另一个通道传入词级别的词向量,使用细粒度的字级别词向量协助词级别的词向量捕获自然语言问句中更深层次的语义信息;最后通过设置不同尺寸的卷积核,学习问句内部更深层次的抽象特征。通过对比实验结果表明,该算法在选用的中文实验数据集上取得了较高的准确率,较其他算法具有一定的优势。
- 杨志明王来奇王泳
- 关键词:卷积神经网络
- SCT-CVAE:基于分离Context机制与CVAE的Transformer对话模型被引量:1
- 2021年
- 现有多轮对话生成的Encoder-Decoder模型容易产生单一的响应,虽然使用条件自动编码器(CVAE)可以有效改善响应的多样性问题,但是基于CVAE的模型大多不能够捕捉上下文中较长的依赖。同时,现有的模型也无法显式处理上下文话语和源语句之间的差异。该文将Transformer与CVAE结合,通过Transformer捕捉对话中的长依赖,使潜在变量可以学习到更丰富的对话分布。通过分离上下文语句的编码实现上下文的信息流向源语句,并使用门控机制来控制上下文话语和源语句的信息融合,捕捉对话中对响应影响更大的信息。实验表明,该模型产生的响应多样性更高,质量更好。
- 苑浩王泳
- 关键词:TRANSFORMER