感谢本站网友broadwell的线索传递!
nvidia最近发布了cuda 12.0开发工具的更新这次更新带来了很多变化,包括支持最新的hopper和阿达·洛芙莱斯gpu架构,升级c 方言,正式支持jit lto,改进和引入新的api等等
本站了解到cuda 12.0的主要功能如下
cu12.0为nvidia的hopper和阿达·洛芙莱斯架构提供可编程功能cu12为hopper和ada架构提供了许多张量运算选项,其中许多支持通用的ptx中间表示合作网格阵列支持c内置函数,用于sm多播的可编程l2缓存,基因组学/dpx指令以及其他新功能
标记为cuda_visible_devices的gpu支持虚拟内存管理api。
应用程序和库开发人员可以通过编程来更新cuda流的优先级。
与之前的api相比,改进后的cuda动态并行化api的性能有了大幅提升。
现在正式支持通过nvjitlink库进行即时链接优化。
支持gcc 12.1主机编译器。
nvcc和nvrtc对c 20方言的支持。
nvrtc将其默认的c 方言从c 14更新到c 17。
。