RAG Security
2026
Back-Reveal 論文閱讀分析:真正麻煩的也許不是 Agent 當場被注入,而是那個會偷資料的行為早就被種進模型裡
論文基本資訊 論文標題:Your LLM...
2026 年 4 月 17 日
Zombie Agents 論文閱讀分析:當 AI Agent 會自己把教訓寫進記憶裡,Prompt Injection 就可能從當場失控變成長期感染
Zombie Agents 這篇論文最重要的提醒是:對會跨 session 寫入與重用長期記憶的 agent 來說,真正危險的已經不只是當前回合的 indirect prompt injection,而是這些外部惡意內容被 agent 自己內化成未來還會再用的記憶。當 memory evolution 成為攻擊面,一次 benign exposure 就可能演變成持久化的 agent compromise。
2026 年 4 月 17 日
Agentic AI 攻防全景論文閱讀分析:當 AI Agent 變成系統後,安全邊界也得重畫
這篇 USENIX Security 2026 綜述真正重要的地方,不是再說一次 agent 很危險,而是把 prompt、RAG、工具、外部元件與多代理人互動重新放進同一張攻防地圖,提醒我們 agent security 的本質其實是系統安全。
2026 年 4 月 10 日
