2026

AgentDyn 論文閱讀分析:如果你的 Agent 防禦只能靠忽略外部世界,那它多半還沒準備好真的上線

AgentDyn 最重要的不是又做了一套 prompt injection benchmark,而是直接揭穿目前很多 agent 防禦之所以看起來有效,靠的其實是過度簡化的測試場景。當任務需要動態規劃、外部環境真的含有 helpful instructions、流程又夠長夠複雜時,許多現有防禦不是擋不住,就是直接把功能一起擋死。

2026 年 4 月 18 日