芯片主如果Rubin GPU、Vera CPU、NVLink 6.0互联、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6收集交换机,以及此次参加的Groq 3 LPU,后者是NVIDIA去岁尾花了200亿美元收购获得的LPU技巧授权,重要面向推理AI应用。
再往后就是下一代的GPU架构费曼Feynman,首发台积电的A16,也就是1.6nm级的工艺,还有3D客栈封装,定制的HBM内存,搭配的是新一代的LP40 LPU芯片,还有NVLink 8.0、CX10等全新一代芯片,估计2028年问世。
这7款芯片要搭配5种机架——Vera Rubin NVL72 机架、Vera CPU 机架、Groq 3 LPX 机架、BlueField-4 STX 存储机架、Spectrum-6 SPX 以太网机架,最终才能形成完全体。

这个机能到底有多夸大,黄仁勋在现场提出了一个比较——比拟10年前的计算体系,Vera Rubin的机能晋升了4000万倍——细心对着后面的一堆零数了几回才肯定没看错,不过这个数据是比较的10年前什么体系就不得而知了。

推敲到黄氏比较法也不是第一次出现了,4000万倍的晋升也没须要较真,因为10年前的计算体系没有什么AI机能的概念,FP4之类的算法更是不会支撑,Vera Rubin随便秒杀之前的顶级体系都没啥不测的。
最终Vera Rubin平台实现了高达3.6ExaFlops(1E就是100亿亿次)的机能,260TB/s的全收集带宽,100%水冷散热,Token生成速度每秒7亿个。
Vera Rubin还不会是NVIDIA最强的AI体系,接下来还会有Vera Rubin Ultra,GPU数量从当前的72个晋升到144个,机能再次翻倍都没问题。


发表评论 取消回复