GTC 2024硬件一览:史上最强AI芯片GB200揭完美电竞橥高达80亿晶体管

 行业动态     |      2024-03-21 08:14:15    |      小编

  当专家还正在睡梦中时,大洋彼岸有一场“科技春晚”静静召开。没错,又到了一年一度的GTC大会工夫。本年的GTC大会分歧以往,终归收复了线号。先给不会意GTC的玩家先容一下,GTC是合于AI的NVIDIA拓荒者大会,聚会中你能够会意何如运用AI、加快计较以及数据科学去塑造以至是变动宇宙。

  本年的GTC峰会重心全体环绕AI开展,2个幼时的工夫,老黄又一次带来了AI的改变工夫。当然除了老黄的开张演讲表,后面又有900多场饱吹人心的聚会正在等着你。同时此次GTC大会还吸引了胜过200家展商,会聚了数千名分歧行业范围的从业职员一同出席。雄厚多彩的本事分享、越见出多的革新本事,称它是AI的嘉会都不为过。念必你也好奇老黄事实正在GTC上带来了什么惊喜吧,别张惶,本篇带你一见GTC峰会上的那些硬件产物。

  峰会伊始,咱们谙习的皮衣刀客准时退场。一上来就直奔这日的重心——AI,并吐露“加快式计较机的分娩力曾经达到了一个变动点,天生式AI正正在加快起色完美电竞,而咱们必要以一种全新的格式实行计较,才不妨进一步升高计较机分娩力。”

  而且还知心的浮现了其本身亲手画出的合于计较机分娩力的演变流程,结果一项恰是这日的核心!

  没错,老黄正在GTC宣告推出新一代GPU Blackwell。这里先先容一下Blackwell架构,此前NVIDIA推出的显卡日常是两种架构,个中游戏显卡比如咱们谙习的RTX 40系则是Ada Lovelace架构,而面向AI完美电竞、大数据等操纵的专业级显卡则采用Hopper 架构。

  而老黄正在大会上则吐露“Blackwell不是一个芯片,它是一个平台的名字。”趣味是Blackwell架构将同时用于以上两品种型的产物。借帮这一架构,NVIDIA将推出涵盖多个操纵范围的显卡,即RTX 50系显卡也会是这个架构。而且从老黄手上的芯片能够看出,新的Blackwell GPU的体积光鲜比上代Hopper GPU要更大少许。

  至于这个架构名字的由来,则要追溯到美国科学院首位黑人院士、加州大学伯克利分校首位黑人终生教诲戴维·布莱克维尔(David Blackwell),它是闻名的数学家、统计学家,只是很怜惜的是这位教诲正在2010年因病弃世。

  言反正传,让咱们一连合切此次Blackwell GPU。“咱们必要更大的GPU,若是不行更大,就把更多GPU组合正在沿途,造成更大的虚拟GPU。”老黄正在GTC上也确实这么干了。Blackwell架构的首个GPU为B200,因为目前4nm造程工艺曾经亲近极限,于是NVIDIA也玩起了“拼图”,B200采用台积电的 4 纳米(4NP)工艺蚀刻而成,由两个芯片通过NVLink 5.0组合正在沿途,以10TB每秒的满血带宽互联,总的晶体管数目更是到达了可骇的2080 亿。

  第五代NVLink互连则是将多个Blackwell GPU组合起来的首要东西。它与古代的PCIe相易机分歧,NVLink带宽有限,能够正在办事器内的GPU之间实行高速直接互连。目前第五代NVLink可每个GPU 供应了1.8TB/s双向含糊量,确保多达576个GPU之间的无缝高速通讯。

  这个RAS牢靠性引擎则是基于AI实行,Blackwell 透过专用的牢靠性、可用性和可保护性 (RAS) 引擎,可弥补灵敏规复才干,赶早辨认出也许发作的潜正在阻滞,尽也许缩短停机工夫。

  Secure AI担当供应秘密运算效力,同时Blackwell也是业界第一款救援EE-I/O的GPU,它能够正在不影响本能的条件下,保护你的数据安定,这看待金融、医疗以及AI方面有极大效用。

  结果一项革新本事则是合于解压缩层面,原料了解和原料库办事流程此前更多是仰赖CPU 实行运算。若是放到GPU中实行则可大幅晋升端对端了解的效用,加快成立代价,同时消浸本钱。

  Blackwell装备了专用的解压缩引擎,行使进程中能够配合内置的Grace CPU实行每秒900 GB的双向频宽,而且还能统筹最新的压缩体式 (如 LZ4、Snappy和Deflate等)。

  而两个B200 GPU与Grace CPU集合就成为这日“炎热”的GB200超等芯片。这款超等芯片的本能加倍惊人,你认为H100曾经很速了?不!GB200更速,过去,正在90天内教练一个1.8万亿参数的MoE架构GPT模子,必要8000个Hopper架构GPU硬件产品。现正在,你只消2000个Blackwell GPU就能够竣工。

  官方称,正在法式的1750亿参数GPT-3基准测试中完美电竞,GB200的本能是H100的7倍,供应的教练算力是H100的4倍。

  不止是本能更速更强,Blackwell GPU还相当节能。仍然同样的操作,90天内教练一个1.8万亿参数的MoE架构GPT模子,8000个Hopper GPU要浪费15兆瓦功耗,而今的Blackwell GPU仅需1/4的能耗就能实行完美电竞。

  若是你必要更强劲的GPU,NVIDIA也面向有大型需求的企业供应造品办事,供应完全的办事器。比如:GB200 NVL72,它将36个CPU和72个GPU插入一个液冷机架中,总共可实行720 petaflops的AI教练本能或1,440 petaflops(1.4 exaflops)的推理。

  与相像数主意72个H100比拟,GB200 NVL72的本能绝对是逆天的存正在,大模子推理本能能够晋升30倍,而且本钱和能耗只要前者的1/25。

  以上即是本次GTC 2024的硬件合连报道,也许有玩家会说,怎样没有游戏显卡?原本依据过往常规,NVIDIA并没有正在GTC上推出消费级显卡的习气。只是本次NVIDIA正在GTC 2024上推出的B100显卡所行使的架构是Blackwell,上面咱们也讲过了,这是一个横跨数据中央与消费级产物的架构,这也就意味着咱们谙习的GeForce显卡应当也是统一架构的产物,不出无意的话,下半年咱们就希望看到心心念念的RTX 50系显卡了!GTC 2024硬件一览:史上最强AI芯片GB200揭完美电竞橥高达2080亿晶体管