您的位置: 专家智库 > >

赵玉文

作品数:20 被引量:5H指数:2
供职机构:中国科学院软件研究所更多>>
发文基金:国家自然科学基金中国科学院战略性先导科技专项北京市自然科学基金更多>>
相关领域:自动化与计算机技术理学更多>>

文献类型

  • 15篇专利
  • 5篇期刊文章

领域

  • 12篇自动化与计算...
  • 1篇理学

主题

  • 10篇大整数
  • 7篇大整数乘法
  • 5篇FFT
  • 5篇并行化
  • 4篇调度
  • 4篇调度策略
  • 4篇动态调度
  • 4篇动态调度策略
  • 4篇数据相关
  • 4篇数据相关性
  • 3篇多核
  • 3篇多核并行
  • 3篇处理器
  • 3篇COMB
  • 3篇OPENMP
  • 2篇代码
  • 2篇代码设计
  • 2篇代数
  • 2篇递归
  • 2篇多线程

机构

  • 20篇中国科学院软...
  • 3篇北京大学
  • 3篇中国科学院大...

作者

  • 20篇赵玉文
  • 19篇刘芳芳
  • 15篇杨超
  • 10篇蒋丽娟
  • 6篇解庆春
  • 5篇孙乔
  • 3篇马文静
  • 2篇张鹏
  • 2篇李会元
  • 2篇杜胜
  • 2篇钟伟
  • 2篇申超
  • 2篇许永超
  • 2篇刘昊
  • 1篇孙家昶
  • 1篇蔡颖

传媒

  • 3篇软件学报
  • 1篇计算机系统应...
  • 1篇数值计算与计...

年份

  • 3篇2023
  • 1篇2021
  • 2篇2020
  • 2篇2019
  • 2篇2018
  • 4篇2017
  • 3篇2016
  • 3篇2015
20 条 记 录,以下是 1-10
排序方式:
基于浮点数压缩技术的大规模FFT实现方法及装置
本公开涉及一种基于浮点数压缩技术的大规模FFT实现方法及装置,所述方法包括:对第i个维度的FFT计算结果进行共享指数浮点数压缩,并将压缩结果打包成第i个维度的压缩数据之后,拷贝至所述主机端;获取所述第i个维度的压缩数据后...
赵玉文刘芳芳马文静李会元彭远驰
基于浮点数压缩技术的大规模FFT实现方法及装置
本公开涉及一种基于浮点数压缩技术的大规模FFT实现方法及装置,所述方法包括:对第i个维度的FFT计算结果进行共享指数浮点数压缩,并将压缩结果打包成第i个维度的压缩数据之后,拷贝至所述主机端;获取所述第i个维度的压缩数据后...
赵玉文刘芳芳马文静李会元彭远驰
一种大整数乘法Karatsuba算法的并行实现方法
本发明公开了一种大整数乘法Karatsuba算法的并行实现方法,基于64位无符号长整型整数操作,通过巧妙的公式转换技巧,指针运算以及存储方式,以解决部分积存储与计算的相关性问题,通过OpenMP多线程编程,采用secti...
蒋丽娟杜胜杨超许永超刘芳芳钟伟赵玉文申超
文献传递
一种大整数乘法Comba算法基于OpenMP的并行实现方法
本发明公开了一种大整数乘法Comba算法基于OpenMP的并行实现方法,基于64位无符号长整型整数操作,通过添加三个临时数组存储加乘操作计算得到的中间结果,从而解决加乘运算与进位运算的数据相关性,将加乘操作与进位操作分开...
蒋丽娟杨超刘芳芳赵玉文解庆春
一种基于申威平台的基础线性代数库BLAS三级函数GEMM的高性能实现方法
本发明提出了一种基于申威平台的基础线性代数库BLAS三级函数GEMM的高性能实现方法,针对国产申威SW1600平台,采用“interface接口?driver驱动?kernel汇编核心代码”的三层代码设计框架,使用乘加指...
刘昊杨超刘芳芳赵玉文张鹏孙乔
大整数乘法Sch?nhage-Strassen算法的多核并行化研究被引量:2
2018年
基于数论转换的Sch?nhage-Strassen算法(简称SSA)是目前实际应用中使用较多、速度较快的大整数乘法算法之一.首先对SSA算法原理进行了详细分析,然后从细粒度的角度对SSA算法在多核平台进行比较细致的并行优化.基于大整数运算开源库GMP实现了SSA算法并行化方案,并在Intel X86平台进行了验证和测试.经测试,8线程时的最大加速比可达到6.59,平均加速比6.41.在浪潮TS850服务器对并行方案的扩展性进行测试,实验结果表明:SSA算法并行方案具有良好的扩展性,最大加速比可达21.42.
赵玉文刘芳芳蒋丽娟杨超
关键词:大整数乘法傅里叶变换FFT多核并行
国产申威26010众核处理器上多维FFT的高性能实现方法
本发明提出一种国产申威26010众核处理器上多维FFT的高性能实现方法,基于国产处理器申威26010平台,将两层分解的一维FFT的求解算法,有效应用于多维FFT计算,并设计带输入输出跨度的FFT、多行一维FFT和多列一维...
杨超赵玉文张佳佳刘芳芳孙乔
文献传递
基于FFT的大整数乘法SSA算法多核并行化实现方法
一种基于FFT的大整数乘法SSA算法多核并行化实现方法,其是从细粒度的角度对大整数乘法SSA算法进行多核并行优化,其核心是对利用SSA算法求取负循环卷积的四个核心计算过程分别进行并行设计,即分别对分解、FFT正变换、点乘...
赵玉文刘芳芳杨超解庆春蒋丽娟
一种基于GMP的大整数加法和减法多核并行化实现方法
本发明涉及一种基于GMP的大整数加法和减法多核并行化实现方法,首先借助于临时数组来解决加法或减法操作产生的进位或借位带来的数据相关性问题,然后采用将迭代循环for中的运算进行任务划分,基于OpenMP多线程编程实现,使用...
赵玉文刘芳芳解庆春杨超蒋丽娟
一种大整数乘法Karatsuba算法的并行实现方法
本发明公开了一种大整数乘法Karatsuba算法的并行实现方法,基于64位无符号长整型整数操作,通过巧妙的公式转换技巧,指针运算以及存储方式,以解决部分积存储与计算的相关性问题,通过OpenMP多线程编程,采用secti...
蒋丽娟杜胜杨超许永超刘芳芳钟伟赵玉文申超
文献传递
共2页<12>
聚类工具0