GTC 2024硬件一览:史上最强AI芯片GB2完美电竞00颁布 高达2080亿晶体管

 行业动态     |      2024-03-21 18:10:08    |      小编

  当民多还正在睡梦中时,大洋彼岸有一场“科技春晚”悄悄召开。没错,又到了一年一度的GTC大会时间。本年的GTC大会分歧以往,终归复原了线号。先给不体会GTC的玩家先容一下,GTC是闭于AI的NVIDIA开辟者大会,集会中你可能体会何如诈骗AI、加快策画以及数据科学去塑造以至是变换全国。

  本年的GTC峰会要旨全部环绕AI睁开,2个幼时的时辰,老黄又一次带来了AI的革新时间。当然除了老黄的开张演讲表,后面再有900多场驱策人心的集会正在等着你。同时此次GTC大会还吸引了超越200家展商,会聚了数千名分歧行业规模的从业职员一同到场。充足多彩的身手分享、越见出多的革新身手完美电竞,称它是AI的嘉会都不为过。念必你也好奇老黄底细正在GTC上带来了什么惊喜吧,别发急,本篇带你一见GTC峰会上的那些硬件产物。

  峰会伊始硬件产品,咱们谙习的皮衣刀客准时退场。一上来就直奔此日的要旨——AI,并显示“加快式策画机的分娩力一经达到了一个转嫁点,天生式AI正正在加快发达,而咱们需求以一种全新的格式实行策画,才也许进一步降低策画机分娩力。”

  而且还知心的显示了其我方亲手画出的闭于策画机分娩力的演变流程,结尾一项恰是此日的要点!

  没错,老黄正在GTC揭晓推出新一代GPU Blackwell。这里先先容一下Blackwell架构,此前NVIDIA推出的显卡平常是两种架构,此中游戏显卡比如咱们谙习的RTX 40系则是Ada Lovelace架构,而面向AI、大数据等行使的专业级显卡则采用Hopper 架构。

  而老黄正在大会上则显示“Blackwell不是一个芯片,它是一个平台的名字。”笑趣是Blackwell架构将同时用于以上两品种型的产物。借帮这一架构,NVIDIA将推出涵盖多个行使规模的显卡,即RTX 50系显卡也会是这个架构。而且从老黄手上的芯片可能看出,新的Blackwell GPU的体积清楚比上代Hopper GPU要更大极少。

  至于这个架构名字的由来,则要追溯到美国科学院首位黑人院士、加州大学伯克利分校首位黑人终生教诲戴维布莱克维尔(David Blackwell),它是知名的数学家、统计学家,可是很惋惜的是这位教诲正在2010年因病物化。

  言反正传,让咱们持续眷注此次Blackwell GPU。“咱们需求更大的GPU,倘使不行更大完美电竞,就把更多GPU组合正在一块,酿成更大的虚拟GPU。”老黄正在GTC上也确实这么干了。Blackwell架构的首个GPU为B200,因为目前4nm造程工艺一经靠近极限,因此NVIDIA也玩起了“拼图”,B200采用台积电的 4 纳米(4NP)工艺蚀刻而成,由两个芯片通过NVLink 5.0组合正在一块,以10TB每秒的满血带宽互联,总的晶体管数目更是到达了恐惧的2080 亿硬件产品。

  第五代NVLink互连则是将多个Blackwell GPU组合起来的苛重东西。它与守旧的PCIe互换机分歧,NVLink带宽有限,可能正在效劳器内的GPU之间竣工高速直接互连。目前第五代NVLink可每个GPU 供给了1.8TB/s双向含糊量,确保多达576个GPU之间的无缝高速通讯完美电竞。

  这个RAS牢靠性引擎则是基于AI竣工,Blackwell 透过专用的牢靠性、可用性和可爱护性 (RAS) 引擎,可添加伶俐复兴材干,趁早辨认出恐怕爆发的潜正在毛病,尽恐怕缩短停机时辰。

  Secure AI职掌供给秘要运算效用,同时Blackwell也是业界第一款维持EE-I/O的GPU,它可能正在不影响功能的条件下,爱护你的数据安笑,这关于金融、医疗以及AI方面有极大功用。

  结尾一项革新身手则是闭于解压缩层面完美电竞,材料说明和材料库事情流程此前更多是仰赖CPU 实行运算。倘使放到GPU中实行则可大幅擢升端对端说明的效用,加快缔造价钱,同时低落本钱。

  Blackwell装备了专用的解压缩引擎,应用历程中可能配合内置的Grace CPU竣工每秒900 GB的双向频宽,而且还能两全最新的压缩方式 (如 LZ4、Snappy和Deflate等)。

  而两个B200 GPU与Grace CPU连结就成为此日“炎热”的GB200超等芯片。这款超等芯片的功能尤其惊人,你认为H100一经很疾了?不!GB200更疾完美电竞,过去,正在90天内锻练一个1.8万亿参数的MoE架构GPT模子,需求8000个Hopper架构GPU。现正在,你只消2000个Blackwell GPU就可能完毕。

  官方称,正在程序的1750亿参数GPT-3基准测试中,GB200的功能是H100的7倍,供给的锻练算力是H100的4倍。

  不止是功能更疾更强,Blackwell GPU还相当节能。仍旧同样的操作硬件产品,90天内锻练一个1.8万亿参数的MoE架构GPT模子,8000个Hopper GPU要销耗15兆瓦功耗硬件产品,今朝的Blackwell GPU仅需1/4的能耗就能竣工。

  倘使你需求更强劲的GPU,NVIDIA也面向有大型需求的企业供给造品效劳,供给完好的效劳器。比如:GB200 NVL72,它将36个CPU和72个GPU插入一个液冷机架中,总共可竣工720 petaflops的AI锻练功能或1,440 petaflops(1.4 exaflops)的推理。

  与相仿数主意72个H100比拟完美电竞,GB200 NVL72的功能绝对是逆天的存正在,大模子推理功能可能擢升30倍,而且本钱和能耗唯有前者的1/25。

  以上便是本次GTC 2024的硬件闭联报道,恐怕有玩家会说,如何没有游戏显卡?原来依据过往向例,NVIDIA并没有正在GTC上推出消费级显卡的风气。可是本次NVIDIA正在GTC 2024上推出的B100显卡所应用的架构是Blackwell,上面咱们也讲过了,这是一个逾越数据中央与消费级产物的架构,这也就意味着咱们谙习的GeForce显卡应当也是统一架构的产物,不出不测的话,下半年咱们就希望看到心心念念的RTX 50系显卡了!GTC 2024硬件一览:史上最强AI芯片GB2完美电竞00颁布 高达2080亿晶体管