ICC訊 拉斯維加斯AWS re:Invent大會現(xiàn)場——今年,AWS可謂手握一手好牌。首席執(zhí)行官Matt Garman在主題演講中重點介紹了兩項AI基礎(chǔ)設(shè)施公告以及三項模型更新。以下是你需要了解的此次大會重點。
AI工廠登場,電信運營商面臨挑戰(zhàn)
AWS首次推出了其“AI工廠”產(chǎn)品。該產(chǎn)品將允許客戶在其現(xiàn)有的數(shù)據(jù)中心空間內(nèi)部署AWS芯片、網(wǎng)絡(luò)和AI服務(wù)以及英偉達的計算平臺,以滿足AI計算和數(shù)據(jù)主權(quán)兩方面的需求。
一方面,看到AWS發(fā)布此消息實在令人遺憾。原因在于,“AI工廠”曾是電信運營商如何避免重蹈“啞管道”覆轍的一個答案。德國電信、Orange、瑞士電信和Telenor等運營商已開始朝著正確的方向邁出試探性的步伐。但當它們還在摸索,并且以典型的電信業(yè)速度緩慢推進時,AWS卻早已忙于構(gòu)建企業(yè)和公共部門客戶正在尋找的完整方案。
另一方面,我們早就預(yù)言過結(jié)局會是這樣。在數(shù)據(jù)主權(quán)方面,電信運營商可能仍有一些角色可以扮演,但AWS已經(jīng)明確將目標對準了那些有監(jiān)管和主權(quán)要求的客戶,并宣揚其能夠在公司現(xiàn)有設(shè)施中部署專用基礎(chǔ)設(shè)施的能力。
AvidThink創(chuàng)始人兼負責人Roy Chua認為,這項發(fā)布可能具有雙重影響。他告訴Fierce,雖然AWS AI工廠“可能被視為與一些電信運營商的舉措存在競爭關(guān)系”,但運營商也“可以將AI工廠視為一種讓AWS幫助其建立自身私有AI能力的方式——即電信運營商可以為自己業(yè)務(wù)利用的、獨立的私有AI基礎(chǔ)設(shè)施”。我們猜想,他們別無選擇,只能設(shè)法從這些挑戰(zhàn)中尋找機遇。
芯片重磅發(fā)布:Trainium 3上市,Trainium 4預(yù)覽
re:Invent大會上還有兩條重要的芯片新聞。第一條是關(guān)于Trainium 3的全面上市。這款A(yù)I訓練芯片是AWS在去年的re:Invent大會上宣布的。與上一代芯片相比,Trainium 3提供了4.4倍的計算能力、3.9倍的內(nèi)存帶寬,以及每毫瓦功耗下5倍的AI令牌處理能力。
AWS還預(yù)告了仍在開發(fā)中的Trainium 4。Garman表示,與Trainium 3相比,下一代芯片將提供6倍的FP4性能、4倍的內(nèi)存帶寬和2倍的內(nèi)存容量。
但這些性能提升并不一定意味著AWS正在試圖挑戰(zhàn)英偉達。Futurum Group首席執(zhí)行官Daniel Newman告訴Fierce:“我不知道誰需要聽到這個,但并非每一款新發(fā)布的AI芯片都‘旨在與英偉達競爭或擊敗它’。我們正處在一個巨大技術(shù)超級周期的開端,每一款能為AI生產(chǎn)的芯片都在熱銷?!币簿褪钦f,市場需求足夠大,足以讓所有參與者分得一杯羹,這不是一場零和游戲。
盡管如此,F(xiàn)uturum Group副總裁兼AI平臺實踐負責人Nick Patience告訴Fierce,如果Trainium能夠“突破‘溢出需求’的定位,獲得廣泛的財富500強企業(yè)采用”,那對亞馬遜來說可能是一個巨大的福音。不過,到目前為止,這尚未發(fā)生。
模型家族更新與應(yīng)對技術(shù)債務(wù)的新工具
AWS在其Nova基礎(chǔ)模型家族中推出了一系列新選項。其中包括適用于各種工作負載的“主力模型”Nova Lite、用于智能推理的Nova 2 Pro,以及具有先進多模態(tài)輸入輸出能力的Nova 2 Omni。
AWS還推出了Nova Forge服務(wù)。Garman介紹,這項服務(wù)引入了開放式訓練模型的概念。也就是說,F(xiàn)orge允許企業(yè)在Nova訓練過程中的各個檢查點注入其專有數(shù)據(jù),從而創(chuàng)建可在Amazon Bedrock中使用的定制化“Novellas”模型。索尼是Nova Forge的使用者之一,他們利用該工具創(chuàng)建了一個基于Nova 2的內(nèi)部模型,以改進其合規(guī)實踐。
可以將這視為超越了檢索增強生成技術(shù)的一步。AWS不僅僅是讓企業(yè)在其數(shù)據(jù)上進行推理查詢,而是真正將這些數(shù)據(jù)整合到模型訓練過程中,以創(chuàng)建定制模型。我們認為這有可能進一步推動Trainium的采用,因為Trainium就是為處理此類微調(diào)工作負載而設(shè)計的。
除了模型更新,亞馬遜還推出了新的Frontier Agents。你可以在這里閱讀更多相關(guān)信息,以及圍繞該公司AI快速進展引發(fā)的爭議。
應(yīng)對技術(shù)債務(wù)
AWS也在利用智能體AI的力量來應(yīng)對技術(shù)債務(wù)。AWS Transform正在獲得一套新的智能體AI工具集,旨在加速舊有企業(yè)代碼和應(yīng)用程序的現(xiàn)代化改造,并且能夠跨任何API、框架、架構(gòu)或語言工作。
考慮到阻礙AI應(yīng)用的技術(shù)債務(wù)規(guī)模驚人,這顯然是一件大事。正如Garman在臺上指出的,埃森哲估計技術(shù)債務(wù)每年給美國企業(yè)造成總計2.4萬億美元的損失,而高德納咨詢公司發(fā)現(xiàn)70%的IT預(yù)算被遺留系統(tǒng)消耗。
事實上,AWS并非唯一致力于解決此問題的公司。微軟在五月份通過GitHub CoPilot推出了AI驅(qū)動的應(yīng)用程序現(xiàn)代化功能。
值得注意的是,AWS特別瞄準了Windows現(xiàn)代化,宣稱其智能體是一種快速簡便的方法,可以將.NET應(yīng)用程序、SQL Server和舊版用戶界面升級到不受許可協(xié)議約束的開源替代方案。還有用于大型機和VMware遷移的新智能體。
Chua告訴Fierce,這些新工具可能有助于加速云遷移,并最終“為AI/其他投資釋放資源”。他補充說,電信運營商甚至可能受益,或許能夠利用這些工具來改造“諸如計費和OSS/BSS等已有數(shù)十年歷史的核心系統(tǒng)”。
原文:https://www.fierce-network.com/cloud/heres-what-we-think-aws-big-reinvent-news