輝達完成收購 Groq 協議 擬於 GTC 2026 發表 LPU 技術整合產品

编辑者: Aleksandr Lytviak

輝達(Nvidia)於 2025 年 12 月完成一項重大授權協議,收購人工智慧晶片新創公司 Groq,據報該交易價值高達 200 億美元。此舉旨在策略性擴張輝達在人工智慧運算領域的版圖,特別是針對推論(Inference)市場的佈局。該協議除了技術授權外,亦包含對 Groq 關鍵人才的兼併與聘用(acqui-hire),其中包括 Groq 的創辦人兼執行長 Jonathan Ross。

Jonathan Ross 過去曾參與 Google 的 Tensor Processing Unit (TPU) 專案,其在晶片架構上的專業知識,特別是對推論優化的見解,被視為此次交易的核心價值。Groq 的核心技術專長在於提供快速且具成本效益的 AI 推論服務,即對已訓練模型進行即時應用的能力。此種專注於推論的發展方向,正值科技產業將資本支出轉向服務終端用戶的趨勢之下。

Groq 的 Language Processing Unit (LPU) 採用獨特的靜態排程架構和基於 SRAM 的記憶體設計,旨在突破傳統 GPU 面臨的「記憶體牆」限制,以實現超低延遲的文本生成。據稱,在特定應用場景下,LPU 能夠提供比傳統 GPU 高出五到十倍的效率。此技術亮點在於採用靜態隨機存取記憶體(SRAM)取代了現有 AI 晶片中廣泛使用的 HBM(高頻寬記憶體)。

儘管採用 SRAM 的設計使得單晶片記憶體容量相對較小(Groq 單晶片約 230 MB),但此架構能顯著提升資料傳輸速度並降低功耗與成本,特別適合需要低延遲的單批次推論工作負載。AI 推論市場的競爭正趨於白熱化,Google 和 Amazon 等科技巨擘亦積極開發客製化晶片以鞏固市場地位。

為應對此競爭並鞏固其在 AI 基礎設施中的地位,輝達預計將在 2026 年 3 月 16 日於聖荷西(San Jose)開幕的 GTC 2026 大會上,正式展示一款整合 Groq LPU 技術的產品。Jensen Huang 的開幕主題演講預計將揭示輝達在加速運算領域的下一步策略,主題將聚焦於實體 AI、代理 AI、AI 工廠和推論等核心議題。

透過整合 Groq 的低延遲知識產權(IP),輝達得以提供涵蓋訓練與推論的完整堆疊解決方案,從而滿足市場對推論效率日益增長的需求,特別是隨著代理 AI 系統複雜度的提升。

3 浏览量

來源

  • Republic World

  • Seoul Economic Daily

  • InsiderFinance

  • Alpha Spread

  • The Times of India

  • BNN Bloomberg

发现错误或不准确的地方吗?我们会尽快处理您的评论。