摘

EP145 - 記憶體如何成爲 AI 的關鍵瓶頸？| 專訪美光資深副總裁 Jeremy Werner 與 Mark Montierth

摘要生成於 2026-07-03 ・回報問題

先說結論：隨著 AI 從「訓練」轉向「推論」以及「AI 代理（Agentic AI）」的興起，記憶體已取代 GPU 成為系統效能與能源效率的最關鍵瓶頸。美光正透過 HBM、DRAM 與 SSD 的層次化架構優化，解決推論過程中的 KV Cache 存儲問題，以支撐未來企業級的 AI 生產力革命。

重點：

- [04:45] 推論性能的決定因素：在 AI 推論中，若記憶體頻寬不足，計算複雜度會呈 $N^2$ 指數增長（需不斷重新計算前面的內容）；若記憶體充足，計算則呈線性增長。這使記憶體成為從「指數級耗時」轉為「線性效能」的關鍵。

- [07:10] AI 代理（Agentic AI）的需求：當多個 AI 代理同時運行時，每個代理都需要獨立的 KV Cache 來存儲對話上下文（Context）。這推動了記憶體層級結構的需求：HBM 負責高頻寬運算，SSD 則開始被用於大規模的上下文存儲。

- [10:48] HBM4 的技術轉向：HBM 不再是標準化商品，而是需與 GPU 廠商（如 Nvidia）及晶圓代工（如 TSMC）進行「協同設計（Co-design）」。HBM4 的頻寬將翻倍，並將邏輯控制晶片與記憶體堆疊深度整合。

- [13:50] 電力是最終限制：數據中心面臨嚴重的電力供應限制。在無法蓋更多數據中心的情況下，提高「每瓦效能（Compute per Watt）」成為核心競爭力，這使得低功耗記憶體（如 LPDDR5）與高效能 HBM 變得極為重要。

- [16:00] 邊緣 AI（Edge AI）的硬體規格：要在手機或 PC 上運行 31B（310 億）甚至 120B 參數的模型，邊緣裝置需要極大的記憶體容量與統一記憶體架構（Unified Memory），以滿足隱私、安全與低延遲（如自動駕駛決策）的需求。

- [21:00] 龐大的基礎設施投資：美光在愛達荷州與紐約州建設的新晶圓廠（Fab），單座投資額超過 100 億美元。其無塵室面積達 60 萬平方英尺，相當於 10 個足球場大小，清潔度比手術室高出 100 倍。

- [26:50] SSD 在 AI 中的新角色：未來 SSD 將用於存儲「上下文存儲（Context Storage）」。當使用者暫時離開對話，系統會將狀態存入 SSD 而非重新計算，這將大幅降低推論成本並提升 Gen6 NVMe SSD 的重要性。

記住這件事：

AI 是一場長期的結構性變革，而非短期熱潮；它將在未來 10-30 年內徹底重塑企業工作流，就像 30 年前 Email 的出現一樣，而記憶體技術正是支撐這場「生產力革命」的基石。

每部影片都想要這樣的摘要?

裝摘要王 Extension — 沒字幕的影片也能摘

在電視或手機上看 YouTube?

登入摘要王,對影片按個讚,摘要自動出現在你的收件匣。

登入摘要王

EP145 - 記憶體如何成爲 AI 的關鍵瓶頸？| 專訪 美光 資深副總裁 Jeremy Werner 與 Mark Montierth

EP145 - 記憶體如何成爲 AI 的關鍵瓶頸？| 專訪美光資深副總裁 Jeremy Werner 與 Mark Montierth