Multi-Agent Security 論文閱讀分析:很多系統一拆成多個 agent,真正被拆掉的不是風險,而是拒絕能力
這篇論文最值得看的,不是它又證明 multi-agent 會出事,而是它把問題精準拉回角色分工、通訊拓樸與記憶可見性:同一個模型只要換一種 orchestration,原本會在 planning 階段拒絕的有害任務,就可能被拆成一串局部合理的步驟一路做完。
2026 年 4 月 29 日
這篇論文最值得看的,不是它又證明 multi-agent 會出事,而是它把問題精準拉回角色分工、通訊拓樸與記憶可見性:同一個模型只要換一種 orchestration,原本會在 planning 階段拒絕的有害任務,就可能被拆成一串局部合理的步驟一路做完。