AI科技產業分析2026.03.22

NVIDIA OpenShell:讓自主 AI Agent 安全執行的三層架構

NVIDIA 在 2026 年 3 月推出 OpenShell,這是 NemoClaw 開源堆疊的核心元件,專門解決自主 Agent 同時達成安全、能力、自主三個條件幾乎不可能的困境。其關鍵創新是「程序外政策強制執行」——把安全限制放在 Agent 執行環境之外,讓 Agent 就算被駭入也無法繞過。

  • 自主 Agent 面臨安全三角困境:安全、能力、自主三者無法同時達成,OpenShell 從架構層解決這個問題
  • 三層防護:沙箱隔離技能開發、政策引擎管控 Agent 行為、隱私路由決定哪些資料可以送出去
  • 支援 OpenClaw、Claude Code、OpenAI Codex、Cursor,零程式碼修改,一行指令部署

自主 Agent 最難解的問題不是「夠不夠聰明」,是「夠不夠安全」

NVIDIA 在 GTC 2026 後連續釋出技術深度文章,OpenShell 是其中最值得細看的一篇。原因很簡單:它直接點出了 AI Agent 落地最核心的矛盾。

文章開頭用一個三角形困境描述問題:一個自主 Agent 如果「安全又自主,但沒有工具和資料存取權」,根本完成不了任務。反過來說,給了完整存取權限、能力也夠強,安全就很難保證。長時間運行的 Agent 有持久的 shell 存取權限和不斷累積的執行上下文,這是靜態聊天機器人從來不需要面對的攻擊面。

NemoClaw 是 NVIDIA 為此推出的開源堆疊,OpenShell 是其治理層,由 Ali Golshan、Alex Watson、John Myers 三位工程師主導開發。

OpenShell 三層架構拆解

沙箱:不只是隔離,是為自我演化 Agent 設計的驗證機制

一般的容器隔離是通用的,OpenShell 的沙箱是針對「會自己學習新技能的 Agent」設計的。當 Agent 嘗試安裝新工具或開發新技能時,沙箱負責驗證這個行為,並提供完整的允許/拒絕決策稽核記錄。可程式化的系統和網路隔離讓開發者可以精細設定哪些行為被允許。

政策引擎:從 prompt 層移到環境層的安全邊界

這是 OpenShell 最核心的設計決策。傳統做法是用 prompt 告訴 Agent「你不能做 X」,問題是 prompt 可以被注入攻擊覆蓋,也可能因為上下文太長而被稀釋。

OpenShell 的政策引擎在程序外運作,也就是在 Agent 的執行環境之外強制執行限制。 原文的比喻很好:這就像瀏覽器的分頁隔離機制,不是靠網頁自己乖乖遵守規則,而是瀏覽器底層不讓跨分頁存取發生。政策引擎在二進位程式、目標位址、呼叫方式、路徑等四個層面評估 Agent 行為,包括套件安裝和子 Agent 的派生都納入管控。

值得注意的設計:Agent 可以「提案」修改政策,但需要開發者核准才能生效。這保留了 Agent 的自主性,同時確保人在決策迴路中。

隱私路由:讓敏感資料留在本地的主動分流機制

隱私路由解決的問題是:Agent 在執行任務時不可避免會碰到敏感資料,但又需要呼叫 Claude、GPT 這類前沿模型來完成複雜推理。OpenShell 的做法是讓路由器根據政策主動決定資料流向——敏感資料用本地開源模型處理,只有在政策明確允許的情況下才送到雲端模型。

這個設計是模型無關的(model-agnostic),不依賴特定模型,決策權在政策而不在 Agent。

相容性與部署範圍

OpenShell 的實際部署門檻很低。一行指令完成沙箱建立:

openshell sandbox create --remote spark --from openclaw

相容的 Agent 包含 NVIDIA OpenClaw、Anthropic Claude Code、OpenAI Codex、Cursor,不需要修改任何程式碼。部署環境從個人的 RTX PC、DGX Spark、DGX Station,到企業級 GPU 叢集,使用完全相同的安全基礎設施。授權為 Apache 2.0 開源。

我的觀點

我認為 OpenShell 這篇技術文章最值得關注的不是產品本身,而是它揭示的一個行業共識:用 prompt 管控 Agent 行為這條路已經走到了極限。 NVIDIA 選擇從執行環境層面解決問題,跟 Anthropic 在 Claude Code 中強調 permission model 的思路方向一致——Agent 越自主,越需要環境層面的硬邊界,而不是軟性的行為指引。

隱私路由這個設計特別有意思。它把「哪些資料可以出去」這個決策從 Agent 手上拿走,交給獨立的政策層,這在企業合規場景下非常關鍵。很多公司不是不想用 AI,是不知道怎麼在不洩露客戶資料的前提下用。這個架構給了一個可執行的答案。

文章結尾提到:「未來 6-12 個月的基礎設施決策將決定企業 Agent 部署的長期模式。」這句話我信。現在選擇用什麼 Agent 框架、什麼安全基礎設施,大概率就是之後幾年的技術鎖定。NVIDIA 在這個節點推 OpenShell,時機點拿捏得很準。

不過我也有個疑問:OpenShell 目前的相容清單(Claude Code、Codex、Cursor)都是 coding agent,對於更廣泛的工作流 Agent 場景(訂單處理、客服、資料分析)能不能適用,文章沒有說清楚。這塊如果能打通,才算真的企業級。

NVIDIA OpenShell 是什麼?和一般容器隔離有什麼不同?

OpenShell 是 NVIDIA NemoClaw 開源堆疊中的執行治理層,專為自主 AI Agent 設計。和一般容器隔離最大的不同是「程序外政策強制執行」:安全限制在 Agent 執行環境之外強制落地,Agent 本身無法覆蓋或繞過,即使遭到 prompt 注入攻擊也一樣。它由沙箱、政策引擎、隱私路由三層組成,針對長時間運行、會自我演化的 Agent 的特殊安全需求設計。

OpenShell 支援哪些 AI Agent?需要修改程式碼嗎?

OpenShell 目前官方相容的 Agent 包含 NVIDIA OpenClaw、Anthropic Claude Code、OpenAI Codex 和 Cursor,不需要修改任何程式碼。透過一行指令即可完成部署。支援從個人 RTX PC、NVIDIA DGX Spark、DGX Station 到企業級 GPU 叢集的所有環境,使用相同的安全基礎設施。授權採 Apache 2.0 開源。

OpenShell 的隱私路由如何保護企業敏感資料?

隱私路由是一個獨立的政策層,負責決定哪些資料可以送到雲端前沿模型(如 Claude、GPT),哪些必須留在本地用開源模型處理。路由決策依據成本和隱私政策,而不是由 Agent 自行判斷。這個設計對企業合規場景特別重要,讓組織在使用 AI Agent 的同時,能確保客戶資料不會在未經授權的情況下離開內部環境。


原文:Run Autonomous, Self-Evolving Agents More Safely with NVIDIA OpenShell|NVIDIA Technical Blog,2026 年 3 月 16 日,作者:Ali Golshan、Alex Watson、John Myers

相關文章

AI科技產業分析
8 萬人告訴 Anthropic 他們想從 AI 得到什麼 — 答案不是「更多生產力」
2026.03.22
AI科技產業分析
GTC 2026 重點整理:NVIDIA 從賣 GPU 轉型為賣 AI 工廠
2026.03.21
AI科技產業分析
Copilot Cowork 解析:微軟為何借 Anthropic 技術做 AI Agent?
2026.03.19
AI科技產業分析
Anthropic 收購 Vercept:Claude 電腦操作能力從 15% 躍升至 72.5%
2026.03.06