Clawed and Dangerous 論文閱讀分析:當開放式 Agent 真正拿到記憶、工具與權限後,安全就不再只是防 Prompt Injection
論文基本資訊 論文標題:Clawed a...
2026 年 4 月 10 日
論文基本資訊 論文標題:Clawed a...
這篇論文把 autonomous LLM agent 的安全問題從零散漏洞,重整成 initialization、input、inference、decision、execution 五層生命週期風險,說明為什麼 point defense 不足以守住 agentic system。
這篇 USENIX Security 2026 綜述真正重要的地方,不是再說一次 agent 很危險,而是把 prompt、RAG、工具、外部元件與多代理人互動重新放進同一張攻防地圖,提醒我們 agent security 的本質其實是系統安全。
AIR 把 detection、containment、recovery、eradication 直接接進 LLM agent execution loop,試圖回答一個常被忽略的問題:當 agent 真的出事時,系統能不能像成熟的 incident response 流程那樣自己發現、止血、修復,並把這次事故轉成未來的 guardrail。