2025 年,亞馬遜云科技(AWS)的re:Invent 大會(huì)不再局限于云計(jì)算領(lǐng)域的年度發(fā)布會(huì),而是全面轉(zhuǎn)向 “AI全棧競(jìng)爭(zhēng)” 的核心布局陣地。
從Trainium自研服務(wù)器芯片、自研大模型Nova 2、企業(yè)級(jí)訓(xùn)練平臺(tái)Nova Forge到新一代AI Agent,AWS試圖用“自研芯片+云基礎(chǔ)設(shè)施+應(yīng)用層AI”的組合拳,建立從底層到上層的閉環(huán)體系。
AWS CEO Matt Garman表示,Trainium的業(yè)務(wù)規(guī)模已達(dá)到數(shù)十億美元,并且迄今為止已經(jīng)部署了100萬(wàn)顆Trainium芯片。
可以看到,云計(jì)算廠商的競(jìng)爭(zhēng)正在從算力規(guī)模走向AI能力結(jié)構(gòu)的全面競(jìng)賽。與此同時(shí),微軟Azure、谷歌云等競(jìng)爭(zhēng)者也在快速推進(jìn)Agent、模型與基礎(chǔ)設(shè)施布局。各大廠商的資本開支呈現(xiàn)全面上漲態(tài)勢(shì),這一趨勢(shì)正推動(dòng)全球云計(jì)算市場(chǎng)進(jìn)入新的加速期。
接下來(lái),科技企業(yè)的底層創(chuàng)新,會(huì)如何改變?cè)朴?jì)算產(chǎn)業(yè)格局,云廠商的競(jìng)爭(zhēng)將走向怎樣的長(zhǎng)期路徑,都將是業(yè)界焦點(diǎn)。

在本屆re:Invent大會(huì)上,最受關(guān)注的是AWS迭代的一系列AI基礎(chǔ)設(shè)施能力。其中包括Trainium系列芯片、全新訓(xùn)練服務(wù)器UltraServers、Nova 2系列基礎(chǔ)模型、Frontier Agents等等。
這些動(dòng)作共同指向一個(gè)核心目標(biāo),即在眼下的AI浪潮中,AWS不再只是傳統(tǒng)云服務(wù)的提供者,而要成為從芯片到模型的AI全棧技術(shù)供應(yīng)商。
首先是芯片層面的戰(zhàn)略,AWS主要有Graviton、Trainium、Inferentia三個(gè)系列。其中,Graviton是CPU芯片,主要對(duì)標(biāo)英特爾;Trainium主打訓(xùn)練,Inferentia主打推理,以AI芯片的標(biāo)簽對(duì)標(biāo)英偉達(dá)、AMD等。此次,AWS宣布了Trainium的進(jìn)展,基于3nm AI芯片Trainium3推出了UltraServers。UltraServers單集群可以集成144顆芯片,算力達(dá)362PFLOPS(FP8),并且支持更高吞吐和更低能源成本。根據(jù)AWS披露的數(shù)據(jù),相對(duì)于上一代產(chǎn)品,其性能提升超過(guò)4倍。
最新款的Trainium4芯片則將面向未來(lái)更大規(guī)模的模型訓(xùn)練與推理場(chǎng)景。AWS推進(jìn)自研芯片的意圖很明確,在全球GPU供應(yīng)鏈緊張、成本不斷抬升的背景下,AWS需要掌握更可控的算力來(lái)源。
這使其與英偉達(dá)的關(guān)系呈現(xiàn)出典型的競(jìng)合特點(diǎn)。一方面,AWS依舊是全球部署英偉達(dá)GPU規(guī)模最大的云廠商,最新推出的P6e-GB300實(shí)例,正是采用了英偉達(dá)GB300 NVL72 GPU的旗艦設(shè)備;另一方面,AWS自研芯片的加速推進(jìn),保障自有業(yè)務(wù)的同時(shí),也在爭(zhēng)奪更多的算力市場(chǎng)空間。
這也反映了近年趨勢(shì),云巨頭都在加碼芯片部署,不論AWS的AI芯片,還是谷歌的TPU,都已經(jīng)從內(nèi)部供應(yīng)走向公開市場(chǎng),和英偉達(dá)、AMD等的競(jìng)合態(tài)勢(shì)愈演愈烈。
芯片之外,AWS在模型、企業(yè)級(jí)平臺(tái)上縱深布局,尤其是面向企業(yè)級(jí)市場(chǎng)發(fā)力。此前,AWS高管在接受21世紀(jì)經(jīng)濟(jì)報(bào)道記者采訪中就談道,AWS的主張一直是企業(yè)需要多個(gè)模型,而不是一個(gè)模型。據(jù)悉,Amazon Bedrock新增18款開源模型,既包括谷歌Gemma 3、英偉達(dá)Nemotron、OpenAI和Mistral AI的模型;也包括國(guó)內(nèi)的頭部大模型阿里Qwen3-NEXT和Qwen3-VL、月之暗面Kimi K2 Thinking、稀宇科技MiniMax M2。
同時(shí),AWS還發(fā)布了4款的Nova 2系列模型,與之匹配的Nova Forge服務(wù),則允許企業(yè)將自身數(shù)據(jù)整合進(jìn)模型訓(xùn)練流程,從而構(gòu)建“企業(yè)知識(shí) + 基礎(chǔ)模型”的專屬能力。
面向企業(yè)端,AWS甚至推出了AI Factories服務(wù),為客戶定制AI設(shè)施。隨著AI進(jìn)入千行百業(yè),以AWS為代表的云廠商,正在重塑自身的“AI基建”護(hù)城河。
基礎(chǔ)能力競(jìng)爭(zhēng)加劇的同時(shí),全球云計(jì)算巨頭們還把目光轉(zhuǎn)向了Agent應(yīng)用端。在業(yè)內(nèi)人士看來(lái),2025年是AI Agent(AI智能體)爆發(fā)元年,底層的硬件廠商,也開始往AI應(yīng)用靠攏。
AWS發(fā)布了Frontier Agents系列,包括面向運(yùn)維的DevOps Agent、安全場(chǎng)景的Security Agent、開發(fā)工作流程的Transform Custom以及復(fù)雜編程的Kiro Autonomous Agent。
這類Agent在人機(jī)對(duì)話基礎(chǔ)上,主要負(fù)責(zé)自動(dòng)執(zhí)行企業(yè)內(nèi)部流程、調(diào)度云資源、處理故障,甚至做出策略判斷。它們也反映了AWS的一個(gè)策略,通過(guò)AI和自動(dòng)化提升企業(yè)對(duì)云資源的依賴度,擴(kuò)大整體云生態(tài)規(guī)模。
與AWS的“基礎(chǔ)設(shè)施型Agent”相比,OpenAI的Agent更適用于知識(shí)工作和個(gè)人效率工具;谷歌的Gemini Agent優(yōu)勢(shì)在于檢索、內(nèi)容生成以及與Workspace的結(jié)合;微軟的Copilot Agents作為生產(chǎn)力入口,深度綁定Office、Teams和Windows,在企業(yè)協(xié)作場(chǎng)景滲透;面向應(yīng)用側(cè),近期阿里千問(wèn)APP公測(cè)版上線,全力進(jìn)軍C端AI應(yīng)用,進(jìn)一步豐富AI的產(chǎn)品線。
而各式各樣的Agent、智能體、AI應(yīng)用紛紛上線,只是新一輪AI云生態(tài)競(jìng)爭(zhēng)的“前哨戰(zhàn)”。
真正的競(jìng)爭(zhēng)正在從單純的云計(jì)算,轉(zhuǎn)向AI計(jì)算和AI生態(tài)。生成式AI推動(dòng)算力需求爆炸式增長(zhǎng),大模型訓(xùn)練、Agent長(zhǎng)時(shí)間運(yùn)行、多云互聯(lián),都使云廠商必須具備多樣化能力。
放眼望去,從芯片、硬件、軟件到應(yīng)用,巨頭們都已經(jīng)集齊,并且在持續(xù)鞏固長(zhǎng)板、補(bǔ)短板。每一年廠商都在進(jìn)化,每一年市場(chǎng)都在重新排位,格局未定之際,大家繼續(xù)猛烈投資。
從海外云廠 商資本開支看,亞馬遜、微軟、谷歌、meta均在2025年大幅加碼資本開支,合計(jì)指引投入超3000億美元,主要用于服務(wù)器、數(shù)據(jù)中心等基礎(chǔ)設(shè)施投資。