用戶名: 密碼: 驗(yàn)證碼:

華為首次展出“算力核彈”!昇騰384超節(jié)點(diǎn)獲評WAIC 2025鎮(zhèn)館之寶

摘要:日前,2025世界人工智能大會(WAIC)在上海開幕,華為首次展出被稱為“算力核彈”的昇騰384超節(jié)點(diǎn)真機(jī),即Atlas 900 A3 SuperPoD。

  ICC訊 7月28日消息,日前,2025世界人工智能大會(WAIC)在上海開幕,華為首次展出被稱為“算力核彈”的昇騰384超節(jié)點(diǎn)真機(jī),即Atlas 900 A3 SuperPoD。

  華為表示,昇騰384超節(jié)點(diǎn)被評選為本次WAIC 2025鎮(zhèn)館之寶。昇騰384超節(jié)點(diǎn)通過高速互聯(lián)總線,突破互聯(lián)瓶頸,讓超節(jié)點(diǎn)像一臺計(jì)算機(jī)一樣工作。

  相比傳統(tǒng)集群,主要有以下3大優(yōu)勢:

  超大帶寬

  超節(jié)點(diǎn)內(nèi)任意兩個AI處理器之間通信帶寬,相較于傳統(tǒng)架構(gòu)提升15倍,超節(jié)點(diǎn)內(nèi)單跳時延降低10倍。

  超低時延

  昇騰超節(jié)點(diǎn)支持全局內(nèi)存統(tǒng)一編址,具備更高效的內(nèi)存語義通信能力。通過更低時延指令級內(nèi)存語義通信,可滿足大模型訓(xùn)練/推理中的小包通信需求,提升專家網(wǎng)絡(luò)小包數(shù)據(jù)傳輸及離散隨機(jī)訪存通信效率。

  昇騰384超節(jié)點(diǎn)是業(yè)界唯一突破Decode時延15ms的方案,滿足實(shí)時深度思考下的用戶體驗(yàn)需求。

  超強(qiáng)性能

  經(jīng)過實(shí)際測試,在昇騰超節(jié)點(diǎn)集群上,LLaMA3等千億稠密模型訓(xùn)練性能可達(dá)傳統(tǒng)集群的2.5倍以上。

  在通信占比更高的Qwen、DeepSeek等多模態(tài)、MoE模型上,可以達(dá)到3倍以上的提升。

  據(jù)了解,昇騰384超節(jié)點(diǎn)首創(chuàng)將384顆昇騰NPU和192顆鯤鵬CPU通過全新高速網(wǎng)絡(luò)MatrixLink全對等互聯(lián),形成一臺超級“AI服務(wù)器”,其算力總規(guī)模達(dá)300Pflops,是英偉達(dá)NVL72的1.7倍。

  網(wǎng)絡(luò)互聯(lián)總帶寬達(dá)269TB/s,比英偉達(dá)NVL72提升107%;內(nèi)存總帶寬達(dá)1229TB/s,比英偉達(dá)NVL72提升113%;單卡推理吞吐量躍升到2300 Tokens/s。

1、凡本網(wǎng)注明“來源:訊石光通訊網(wǎng)”及標(biāo)有原創(chuàng)的所有作品,版權(quán)均屬于訊石光通訊網(wǎng)。未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載我方內(nèi)容的單位,也必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和本站來源。
2、免責(zé)聲明,凡本網(wǎng)注明“來源:XXX(非訊石光通訊網(wǎng))”的作品,均為轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé)。因可能存在第三方轉(zhuǎn)載無法確定原網(wǎng)地址,若作品內(nèi)容、版權(quán)爭議和其它問題,請聯(lián)系本網(wǎng),將第一時間刪除。
聯(lián)系方式:訊石光通訊網(wǎng)新聞中心 電話:0755-82960080-168   Right