Multi-Agent Security

Prompt Injection Kill Chain 論文閱讀分析：很多 agent 真正缺的，不是再多一個過濾器，而是先看清楚髒東西在哪一層被寫進系統

這篇 paper 真正補的，不是再多一個 prompt injection 分數，而是把 agent 失守拆成 EXPOSED、PERSISTED、RELAYED、EXECUTED 四段，讓你看見髒東西究竟在哪個 write node 被寫進系統、又沿哪條 relay path 變成高權限行為。

2026 年 4 月 29 日

Paper Survey

Multi-Agent Security 論文閱讀分析：很多系統一拆成多個 agent，真正被拆掉的不是風險，而是拒絕能力

這篇論文最值得看的，不是它又證明 multi-agent 會出事，而是它把問題精準拉回角色分工、通訊拓樸與記憶可見性：同一個模型只要換一種 orchestration，原本會在 planning 階段拒絕的有害任務，就可能被拆成一串局部合理的步驟一路做完。

2026 年 4 月 29 日

Paper Survey

Conjunctive Prompt Attacks 論文閱讀分析：真正難防的不是哪段內容特別毒，而是兩段各自都像正常話的東西在對的路由上剛好拼起來

這篇論文最值得警惕的地方，不是又多了一種 prompt injection，而是把多代理風險從單點惡意內容拉成跨代理組合條件：user query 裡看似無害的 trigger key，配上被污染 remote agent 的 hidden template，單獨都不夠可疑，但只要 routing 把它們送到同一個地方，整條 agent pipeline 就可能突然變成攻擊面。

2026 年 4 月 21 日

Paper Survey