用戶名: 密碼: 驗(yàn)證碼:

中國首條"算力光軌"通車!國內(nèi)首個(gè)分布式光互連光交換超節(jié)點(diǎn)發(fā)布

摘要:超節(jié)點(diǎn)技術(shù)(SuperPod)是一種通過高帶寬、低時(shí)延互連技術(shù),將大量 GPU芯片整合為統(tǒng)一超級計(jì)算單元的技術(shù)架構(gòu)。它突破了傳統(tǒng)單服務(wù)器架構(gòu)限制,將算力單元的概念擴(kuò)展到了機(jī)柜,甚至跨機(jī)柜層面。

  ICC訊 超節(jié)點(diǎn)技術(shù)(SuperPod)是一種通過高帶寬、低時(shí)延互連技術(shù),將大量 GPU芯片整合為統(tǒng)一超級計(jì)算單元的技術(shù)架構(gòu)。它突破了傳統(tǒng)單服務(wù)器架構(gòu)限制,將算力單元的概念擴(kuò)展到了機(jī)柜,甚至跨機(jī)柜層面。

  在 2025 世界人工智能大會(WAIC)期間,上海儀電聯(lián)合曦智科技、壁仞科技、中興通訊,正式發(fā)布國內(nèi)首個(gè)光互連光交換 GPU 超節(jié)點(diǎn) —— 光躍 LightSphere X。據(jù)介紹,該超節(jié)點(diǎn)基于曦智科技全球首創(chuàng)的分布式光交換技術(shù),采用硅光技術(shù)的光互連光交換芯片、壁仞科技自主原創(chuàng)架構(gòu)的大算力通用 GPU 液冷模組及全新載板互連方案,搭載中興通訊高性能 AI 國產(chǎn)服務(wù)器及儀電智算云平臺軟件,構(gòu)建起高帶寬、低延遲、靈活可擴(kuò)展的自主可控智算集群新范式,即將于上海儀電智算中心落地應(yīng)用。

  在 2025 WAIC 曦智科技光子網(wǎng)絡(luò)成果媒體分享會上,曦智科技創(chuàng)始人、首席執(zhí)行官沈亦晨博士向媒體詳細(xì)介紹了該公司的光互連和光交換技術(shù),也讓記者們對光躍 LightSphere X 背后的技術(shù)原理有了更深層次的理解。

  光互連已成超節(jié)點(diǎn)必選項(xiàng)

  目前業(yè)界有兩種常見的超節(jié)點(diǎn)方案:一種是通過提升單機(jī)柜功耗來部署更多GPU,但受限于數(shù)據(jù)中心單機(jī)柜的功耗天花板,單機(jī)柜GPU密度提升存在瓶頸。另外一種則是采用光互連技術(shù),通過增加機(jī)柜數(shù)量構(gòu)建超節(jié)點(diǎn),突破傳統(tǒng)互連方式下超節(jié)點(diǎn)的物理限制。相比銅纜,光纜的遠(yuǎn)距離傳輸優(yōu)勢可實(shí)現(xiàn)交付與機(jī)柜解耦。

  盡管光互連技術(shù)優(yōu)勢明顯,但在實(shí)際應(yīng)用中仍面臨功耗、成本和可靠性的挑戰(zhàn)。為此,業(yè)界正在向更高集成度的光學(xué)產(chǎn)品演進(jìn)。首先是可插拔光模塊,它的問題是光電轉(zhuǎn)換芯片往往會離GPU距離比較遠(yuǎn),信號完整性、損耗與延遲都會成為挑戰(zhàn)。而超節(jié)點(diǎn)需要我們提升單通道互連帶寬,還要提升通道的密度和數(shù)量,這就催生新的光電融合技術(shù)——近封裝光學(xué)。它將光電轉(zhuǎn)換芯片從交換機(jī)下放到 GPU 板卡后,傳輸距離從 1 米縮短至 10 厘米,互連密度提高 2-3 倍,還可去除 DSP 芯片,大幅減少 GPU 間的通訊延遲。近封裝光學(xué)是目前已批量落地的互連方案。

  下一階段的核心技術(shù)是共封裝光學(xué)(Co-Packaged Optics,CPO)。CPO 是一種將光引擎與計(jì)算或交換芯片通過先進(jìn)封裝技術(shù)集成在同一基板上的光電融合技術(shù)。傳統(tǒng)光模塊通過銅線與芯片連接,存在路徑長、損耗大的問題;CPO 將光引擎與主芯片共封裝后,電信號傳輸距離從厘米級縮短至毫米級,可大幅減少信號損耗與延遲。

  WAIC 2025 期間,曦智科技聯(lián)合燧原科技推出國內(nèi)首款 xPU-CPO 光電共封裝原型系統(tǒng)。該系統(tǒng)通過將光學(xué)引擎與計(jì)算芯片(xPU)在基板上實(shí)現(xiàn)光電共封裝,縮短了電芯片與光芯片的傳輸距離。與傳統(tǒng)可插拔光學(xué)方案相比,其顯著提升了信號完整性,降低了損耗和延遲,同時(shí)大幅降低系統(tǒng)功耗,有效提高光電轉(zhuǎn)換的穩(wěn)定性。

國內(nèi)首款 xPU-CPO 光電共封裝原型系統(tǒng),圖源:曦智科技

  沈亦晨博士表示,該光電共封裝原型系統(tǒng)是全球范圍內(nèi)首次實(shí)現(xiàn)的相關(guān)技術(shù) demo。在這個(gè) demo 中,GPU 芯片通過短距 Serdes(1 毫米),直接以共封裝方式在 GPU 上完成電信號到光信號的轉(zhuǎn)換并直出。作為國內(nèi)首次采用 CPO 技術(shù)實(shí)現(xiàn) GPU 直接出光的成功案例,該項(xiàng)目驗(yàn)證了 xPU-CPO 光電共封裝技術(shù)的可行性與技術(shù)方向,同時(shí)為中國人工智能基礎(chǔ)設(shè)施建設(shè)與先進(jìn)光學(xué)封裝產(chǎn)業(yè)突破奠定了關(guān)鍵技術(shù)錨點(diǎn)。

  他進(jìn)一步介紹:“最終光互連方式應(yīng)該是光芯片和電芯片在同一顆芯片,我們叫3D共封裝方案。通過這種方式,可以比現(xiàn)在互連方式再提高1-2個(gè)數(shù)量級互連帶寬。我們的目標(biāo)是通過近封裝、共封裝、3D共封裝的方式將單芯片帶寬提升至 2000GB/s。同時(shí),通過采用光互連取代電互連,將超節(jié)點(diǎn)單節(jié)點(diǎn)內(nèi)的 GPU 數(shù)量從 8 顆提升至 500 顆。兩者疊加后,超節(jié)點(diǎn)的總帶寬可比現(xiàn)階段的單機(jī) 8 卡提高 3 個(gè)數(shù)量級?!?

  用光交換替代電交換

  WAIC 2025 上,曦智科技與沐曦合作的光互連電交換超節(jié)點(diǎn)方案首次公開亮相。該方案采用線性直驅(qū)光互連技術(shù),具備低延時(shí)、高帶寬、低功耗特性,支持長距離傳輸,突破跨機(jī)柜連接限制,可實(shí)現(xiàn) 8 臺標(biāo)準(zhǔn)服務(wù)器共 64 張 xPU 卡的高速互連,為大模型訓(xùn)練及推理提供更靈活、高效的并行策略支持,從而提升集群整體性能。這也是曦智科技重點(diǎn)落地的技術(shù)路線之一。

  另一個(gè)技術(shù)路線便是光躍 LightSphere X 采用的光互連光交換。沈亦晨博士比喻道:“電交換就像一輛輛小汽車,每個(gè)信號都能在電交換機(jī)上選擇向左或向右傳輸。但在這種模式下,整個(gè)交換容量和速率取決于電交換芯片的運(yùn)算能力,就像受限于紅綠燈的處理能力,在大型超節(jié)點(diǎn)網(wǎng)絡(luò)中容易造成堵塞。此外,不同 GPU 遵循不同協(xié)議,每款 GPU 都需定制專用交換芯片以適配互連協(xié)議,且電交換芯片依賴先進(jìn)工藝,這正是目前國內(nèi)面臨的技術(shù)困境?!?

  通過用光交換替代電交換,信號傳輸模式實(shí)現(xiàn)了從 “公路” 到 “高速鐵路” 的升級。為此,曦智科技發(fā)布了全球首款基于硅光技術(shù)的分布式光交換芯片,這也是光躍 LightSphere X 的底層核心技術(shù)之一,相關(guān)研究論文已被國際通信網(wǎng)絡(luò)領(lǐng)域頂級會議 SIGCOMM 2025 收錄。

  關(guān)于分布式光交換的優(yōu)勢,沈亦晨博士介紹:“在單位互連成本上,由于無需電交換機(jī),直接通過光交換模組實(shí)現(xiàn)交換,成本可降至英偉達(dá) NVL72 系統(tǒng)的 31%,且每個(gè) GPU 的使用效率提升 3.37 倍;該技術(shù)不受協(xié)議限制,所有硅光芯片均可在國內(nèi)自主生產(chǎn),擺脫對先進(jìn)制程的依賴;在冗余機(jī)制上,故障 GPU 可在毫秒級時(shí)間內(nèi)切換至正常 GPU,大幅降低冗余帶來的成本增加?!?

  結(jié)語

  當(dāng)光技術(shù)將超節(jié)點(diǎn)單節(jié)點(diǎn)內(nèi)的 GPU 互連規(guī)模從 8 顆拓展至 500 顆,將總帶寬提升數(shù)個(gè)數(shù)量級時(shí),這背后不僅是從 “公路” 到 “高速鐵路” 的傳輸革命,更是中國在智算基礎(chǔ)設(shè)施核心技術(shù)領(lǐng)域?qū)崿F(xiàn)自主突破的重要標(biāo)志。這些突破不僅為大模型訓(xùn)練與推理注入靈活高效的算力協(xié)同能力,更在成本控制、資源利用率與供應(yīng)鏈安全上構(gòu)建起獨(dú)特優(yōu)勢,為人工智能產(chǎn)業(yè)的規(guī)?;l(fā)展鋪就了更堅(jiān)實(shí)的光互連 “高速路”,也預(yù)示著一個(gè)以光為核、高效協(xié)同的超節(jié)點(diǎn)新時(shí)代正加速到來。

內(nèi)容來自:電子發(fā)燒友網(wǎng)
本文地址:http://tulsarestaurantguide.com//Site/CN/News/2025/08/01/20250801020352856042.htm 轉(zhuǎn)載請保留文章出處
關(guān)鍵字:
文章標(biāo)題:中國首條"算力光軌"通車!國內(nèi)首個(gè)分布式光互連光交換超節(jié)點(diǎn)發(fā)布
1、凡本網(wǎng)注明“來源:訊石光通訊網(wǎng)”及標(biāo)有原創(chuàng)的所有作品,版權(quán)均屬于訊石光通訊網(wǎng)。未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載我方內(nèi)容的單位,也必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和本站來源。
2、免責(zé)聲明,凡本網(wǎng)注明“來源:XXX(非訊石光通訊網(wǎng))”的作品,均為轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé)。因可能存在第三方轉(zhuǎn)載無法確定原網(wǎng)地址,若作品內(nèi)容、版權(quán)爭議和其它問題,請聯(lián)系本網(wǎng),將第一時(shí)間刪除。
聯(lián)系方式:訊石光通訊網(wǎng)新聞中心 電話:0755-82960080-168   Right