OpenAI、博通發表首款AI推理晶片 由台積電生產拚擺脫依賴輝達

by 秦 宛萱

OpenAI今(24)日宣布,與通訊晶片大廠博通(Broadcom)共同開發的首款客製化AI晶片「Jalapeño」已正式完成設計。根據《路透社》報導,這款晶片將交由台積電負責生產,並由加拿大製造商Celestica協助打造專屬伺服器系統。

此舉標誌著OpenAI邁向「全端基礎設施」的關鍵一步,意在降低對輝達(Nvidia)的依賴並控制高昂的AI成本。

專為大型語言模型量身打造  9個月火速達陣

「Jalapeño」被定位為首款「智能處理器(Intelligence Processor)」,是一款特定應用積體電路(ASIC),有別於市面上的通用型加速器改版,Jalapeño是完全從零開始、針對現代大型語言模型(LLM)的推理(Inference)需求量身打造。

在OpenAI工程團隊與博通的合作下,並藉助OpenAI自家AI模型加速優化設計流程,這款晶片從初步設計到送交製造(Tape-out)僅耗費了9個月時間。

這款晶片將專門用於執行AI模型的推理任務,在未來將高效率地處理資料,回應使用者向ChatGPT、Codex及API等應用提出的海量請求。

效能媲美輝達Blackwell 每瓦能效大幅躍升

OpenAI表示,目前Jalapeño晶片的工程樣品已在實驗室中,以目標功耗和效能水準成功運行機器學習工作負載,其中包含驅動GPT-5.3-Codex-Spark模型。

早期測試數據顯示,Jalapeño晶片的每瓦效能(Performance per watt)大幅超越現有市場的最先進水準。

OpenAI硬體計畫負責人Richard Ho強調,研發團隊針對前沿AI模型最關鍵的記憶體移動、網路與服務模式進行了深度優化,讓硬體實際利用率更接近理論峰值。

博通執行長陳福陽(Hock Tan)在受訪時更自信表示,團隊所打造的Jalapeño,其效能表現足以與輝達的Blackwell GPU以及Google所設計的TPU旗鼓相當。

推進全端基礎設施 瞄準10吉瓦算力部署

OpenAI總裁Greg Brockman指出,世界正轉向由算力驅動的經濟,Jalapeño是公司長期全端基礎設施策略的一部分,透過自行設計更多底層堆疊,能以更高的效率提供並普及先進AI服務。

這項合作不僅是單一晶片的推出,更是多代晶片開發計畫的開端。雙方設定了宏大的長期目標,未來將把這款晶片廣泛部署於全球資料中心,最終目標是建置消耗高達10吉瓦(GW)電力的客製化AI加速器系統。

在部署時程方面,OpenAI預計將於2026年底進行初步部署與小規模原型開發,接著在2027年擴大規模,最終預期在2028年上半年達到全面量產全速運轉。

擺脫單一供應商依賴 尋求多元化算力來源

自2022年掀起生成式AI狂潮以來,OpenAI一直是輝達昂貴GPU的最大買家之一。然而,面對爆炸性成長且難以滿足的算力需求,尋求多元化的晶片來源成為OpenAI發展的當務之急。

除了自主研發Jalapeño晶片外,OpenAI為了確保算力供應穩定,近期也積極與其他硬體廠商展開合作。這包含了使用亞馬遜AWS的Trainium晶片,並與輝達的競爭對手AMD以及AI晶片新創Cerebras簽署合作協議。

OpenAI透過多管齊下的硬體戰略,加上自研晶片,試圖降低對輝達的單一依賴,還能在未來硬體採購議價時取得更多籌碼,從而在激烈的AI算力軍備競賽中站穩腳步。

你可能會喜歡