AI模型愈來愈大,推論卻愈跑愈慢,問題究竟卡在哪?輝達(NVIDIA)在最新Rubin平台中,首度將SSD(固態硬碟)納入系統核心架構,讓原本只負責儲存的SSD,直接參與AI推論流程,傳出IC設計廠瑞昱憑藉SSD控制晶片打入輝達關鍵供應鏈,從傳統PC跨足AI伺服器,直接踩進輝達AI記憶體架構核心圈。
AI算力競賽正進入下一回合。過去焦點全在GPU(圖形處理器)、HBM(高頻寬記憶體),但隨模型規模與推論情境不斷放大,真正卡住效率的不只是算力,而是記憶體是否撐得住。輝達在Rubin平台的關鍵動作,正是為此而來。
AI不再只拚算力 SSD突破記憶體瓶頸
隨著代理AI逐漸走向商用,推論流程產生的KV Cache(鍵值快取)資料量呈爆炸性成長。即便HBM頻寬再高,仍難突破成本、容量與能耗的天花板,供應鏈普遍認為,這是推論延遲的新瓶頸。
輝達的策略很清楚:不再讓GPU單點承擔所有記憶體壓力,而是把SSD拉進系統層級,承接、保存並調度推論情境資料,避免每一次推論都「重算一次」。
在Rubin架構下,SSD不再只是資料中心的倉庫,而是直接參與推論流程的一環。除了分攤HBM負載,也讓長情境、多步驟推理的效率顯著提升。
日前,輝達執行長黃仁勳指出,AI正在全面重構運算堆疊,「現在也輪到儲存被重新定義。」供應鏈解讀,等同為「SSD上位」定調。
瑞昱打進核心的關鍵一腳
科技圈盛傳,瑞昱的SSD控制晶片已導入輝達Quantum X InfiniBand交換器主板。該交換器是AI伺服器機櫃中的資料中樞,負責巨量資料交換與低延遲連線,一旦晶片進入核心板卡,地位已非外圍零組件可比。
消息來自業界流出一張交換器內部晶片照,一顆印有瑞昱LOGO的晶片,被判讀為SSD控制晶片,進一步印證打入輝達供應鏈的說法,不過瑞昱維持低調,透露不評論特定客戶的合作細節。
在輝達主導的AI記憶體版圖中,台灣長期缺席HBM核心戰場,只能間接受惠於DDR4/DDR5因產能排擠帶來的缺貨與漲價。真正能直接卡位輝達核心的,是NAND/SSD體系。
從PC到AI雲端 瑞昱的轉型路徑
過去僅有群聯成功站上第一線,如今瑞昱入列,成為台灣第2家直接參與AI記憶體架構的IC設計業者。
瑞昱長年以網通與音訊晶片見長,SSD布局相對低調,但實際耕耘已久。近年公司持續擴大招募SSD軟體與韌體工程師,被視為提前為資料中心與AI推論市場鋪路。
隨Rubin平台確立SSD的新定位,瑞昱也不再只是PC供應鏈的一員,而是跨入AI伺服器與雲端推論的核心戰場。
隨著代理AI商用化,情境記憶的保存與共享,將成為新一代資料中心的基本需求。當SSD被拉進AI核心架構,這場記憶體上位戰,才正要展開。繼群聯之後,瑞昱也正式坐上牌桌。