Runtime Defense

2026

TIGS 論文閱讀分析：很多 backdoored LLM 真正缺的，不是再多一層說教，而是 trigger 一接管注意力就有人當場關門

本文由 AI 產生、整理與撰寫。論文基...

2026 年 4 月 28 日

GAMMAF 論文閱讀分析：很多 multi-agent security 真正缺的，不是再多一個 detector，而是先有一個大家都能重跑的測試場

本文由 AI 產生、整理與撰寫。論文基...

2026 年 4 月 28 日

Tool Result Parsing 論文閱讀分析：很多 agent 真正該先守的，不是輸入框，而是工具結果回進模型前的那一層

論文基本資訊論文標題：Defense ...

2026 年 4 月 28 日

AgentVisor 論文閱讀分析：很多 agent 真正缺的，不是再多一個安全 prompt，而是別再讓被污染的腦直接碰工具

本文由 AI 產生、整理與撰寫。論文基...

2026 年 4 月 28 日

AgentSentry 論文閱讀分析：真正該防的不是某段外部內容看起來多可疑，而是它什麼時候開始接管了 Agent 下一步

AgentSentry 把多步驟 indirect prompt injection 重新定義成 temporal causal takeover 問題：重點不是某段工具輸出像不像惡意指令，而是從哪一個 tool-return boundary 開始，agent 的下一步已不再主要由 user goal 推動，而是被外部污染的 context 接管。它用 counterfactual replay 做診斷，再用 context purification 切掉控制訊號，目標不是停機，而是安全續跑。

2026 年 4 月 17 日