2026

Prompt Injection 2.0 論文閱讀分析:當惡意提示開始跟 XSS、CSRF 與多代理感染混在一起,問題就不再只是模型會不會聽話

這篇論文真正重要的地方,不是再一次說 prompt injection 很危險,而是指出它已經開始和 XSS、CSRF、SQL 生成與多代理感染混成同一條攻擊鏈。當 agent 接上 web、工具與高權限工作流,問題就不再只是模型會不會被一句話帶偏,而是整條控制鏈會不會替攻擊者跨過授權邊界。

2026 年 4 月 18 日

AgentDyn 論文閱讀分析:如果你的 Agent 防禦只能靠忽略外部世界,那它多半還沒準備好真的上線

AgentDyn 最重要的不是又做了一套 prompt injection benchmark,而是直接揭穿目前很多 agent 防禦之所以看起來有效,靠的其實是過度簡化的測試場景。當任務需要動態規劃、外部環境真的含有 helpful instructions、流程又夠長夠複雜時,許多現有防禦不是擋不住,就是直接把功能一起擋死。

2026 年 4 月 18 日