张昱
- 作品数:121 被引量:252H指数:8
- 供职机构:中国科学技术大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术文化科学电子电信经济管理更多>>
- 一种动态共享数据结构的并发访问控制分析方法被引量:1
- 2011年
- 共享数据的并发访问控制是并行编程的关键之一,而对动态共享数据结构的细粒度并发访问控制更是其中的难点.针对操作动态数据结构的指针程序,提出一种并发访问控制的分析方法,该方法采用形状图对程序运行时的动态数据结构和指针变量关系建立抽象,通过形状图推导完成对共享单元的访问控制分析.程序员只需要声明指针及指向单元的共享性和数据结构形状特征,编译器利用本文中的方法分析得到共享单元的访问控制点,并添加使用互斥锁进行访问控制的代码.
- 张伟张昱张昱汪晨
- 关键词:并行编程访问控制
- 带Order子句的XQuery在XML流上的查询实现
- 2008年
- 随着XML的广泛应用,使得作为XML文档查询语言的XQuery成为人们研究的热点问题.将复杂XQuery在XML数据流上的查询应用于服务器/客户端模式来满足高效、实时查询的要求,所实现的XQuery查询原型系统XSIEQ支持嵌套、order子句的多关键字排序等.一次典型的XQuery查询过程可分为XPath查询、查询后处理两个阶段,本文着重描述查询后处理过程,最后给出了XSIEQ和Qizx在查询后处理时间性能上的对比及分析.
- 吴晓勇张昱孙东海
- 关键词:XQUERY查询XPATHXML流
- 一种Python外部函数的静态类型推断方法及系统
- 本发明涉及一种Python外部函数的静态类型推断方法及系统,其方法包括:步骤S1:对Python/C多语言项目进行语言分离;对于分离后得到的C语言文件,识别其中的外部函数声明,分析每个外部函数声明对应的外部函数实现的参数...
- 张昱胡明哲
- 文献传递
- 一种针对于堆内存对象的结构分析
- 2015年
- 对堆内存对象进行存储管理优化需要的支撑信息之一是堆对象的结构信息,本文定义指向图来抽象堆内存对象及其结构,把获取结构信息的过程变成推导指向图的过程.针对过程内的指向图推导,提出一种利用强连通分量和后支配关系的流敏感、域敏感的分析算法.针对过程间的指向图推导,提出一种递归式的上下文敏感的算法.本文的算法在开源编译器LLVM的中间语言上进行了实现.实验表明,本文的算法能达到预期的分析效果.
- 张学令张昱张维
- 关键词:存储管理上下文敏感
- XML数据流的过滤与查询技术
- 1引言当前许多以XML为数据交换标准的应用中,含有相当多以流形式存在的XML数据:1)信息选择分发,如XFilter,YFilter:它按用户提交的需求选择相应的信息发送给用户。
- 张昱吴年
- 关键词:XPATH
- 文献传递
- 动态性感知的深度学习内存分配器
- 2024年
- 深度学习应用程序通常被认为在训练小批量步之间具有规律的内存分配模式.这种规律性在许多情况下是正确的,但由于未知的张量大小以及各种并行执行模式下不确定的执行顺序等因素,内存分配请求在运行时可能会变得动态和不规律.在这些因素作用下,一些基于内存分配的规律性所进行的优化在运行时存在许多不匹配的情况.为了解决这个问题,本文提出了一个动态性感知的深度学习内存分配器.这个分配器在运行时收集内存分配信息并生成内存分配计划,然后通过模拟分配的方式动态调整生成的内存分配计划.实验结果表明,与TensorFlow相比,本文所设计的分配器平均可以达到1.24的加速比,并减少56.34%的CPU内存使用量以及21.13%的GPU显存使用量.
- 黄奕桐张昱
- 关键词:动态性内存分配
- 虚拟内存密集型多线程程序的性能改进方法
- 2018年
- 随着多核处理器的普及,大量基于共享地址空间的虚拟内存密集型多线程程序被开发出来.这类程序的一个重要特征是存在频繁的地址空间操作,例如page faults、mmap.为了保证并发地址空间操作的正确性,操作系统使用一个全局读写锁来同步,然而却导致在高并发时因多个线程竞争该锁而使这类程序性能下降.为了解决该问题,本文提出了一个基于隔离地址空间的线程模型PMthreads,可以完全消除线程在该读写锁上的竞争.通过自定义字符设备驱动轻量级更改Linux内核中进程的全局数据区域以及实现IAmalloc堆分配器,PMthreads可以保持线程共享变量.此外,PMthreads采用Pthreads接口以支持现有的Pthreads程序.在32核机器上,本文使用5个应用进行性能评估,实验结果表明:对于虚拟内存密集型应用histogram和dedup,在32线程时PM threads相对于Pthreads性能提升了2.17倍和3.19倍;在16线程时,非此类应用的linear_regression也因削减假共享带来了8.15倍的性能提升.
- 陈健康张昱
- 关键词:可扩展性
- 引入开源编译器LLVM的编译原理课程改革被引量:5
- 2017年
- 针对计算机及相关专业毕业生在就业过程中暴露出的对编译过程理解不足、动手能力差等问题,阐述开源编译器LLVM的广泛使用和模块化设计的优势,提出结合LLVM的编译原理课程实践新方案,并结合具体实施情况,总结该实践方案的内容、方法、效果和经验教训。
- 张昱桑榆扬
- 面向嘈杂中型量子设备的逻辑-物理比特重映射方法
- 本发明公开了一种面向嘈杂中型量子设备的逻辑‑物理比特重映射方法,针对量子硬件存在的限制,为使量子程序得以在量子设备上有效执行,通过改变量子指令次序和插入SWAP操作完成必要的重映射,使得量子程序适应量子设备的限制,并使执...
- 张昱李权熹邓皓巍
- 文献传递
- 即时编译器辅助的垃圾收集中的插桩算法研究被引量:1
- 2010年
- 即时编译器辅助的垃圾收集技术结合显式和自动内存管理的优点,在编译阶段由即时编译器分析应用程序并在其中插桩显式释放内存的指令,以便垃圾收集器及时回收死亡对象所占用的内存空间,从而减轻垃圾收集器的负担.提出一种应用于该项技术的插桩算法,它基于控制流中的支配关系并提供不同的插桩策略,保证插桩的正确性和灵活性;它能够主动获得域引用从而释放对象及其域引用的内存空间.实验表明基于该插桩算法的垃圾收集器能够回收大量的内存空间,提高Java程序的执行效率.
- 张昱袁丽娜
- 关键词:插桩即时编译器垃圾收集器内存管理