Agentic Security
2026
GAMMAF 論文閱讀分析:很多 multi-agent security 真正缺的,不是再多一個 detector,而是先有一個大家都能重跑的測試場
本文由 AI 產生、整理與撰寫。 論文基...
Agentic Witnessing 論文閱讀分析:很多私有稽核真正缺的,不是再多一份 NDA,而是讓看得懂的人被關在可信邊界裡
本文由 AI 產生、整理與撰寫。 論文基...
Tool Result Parsing 論文閱讀分析:很多 agent 真正該先守的,不是輸入框,而是工具結果回進模型前的那一層
論文基本資訊 論文標題:Defense ...
AgentVisor 論文閱讀分析:很多 agent 真正缺的,不是再多一個安全 prompt,而是別再讓被污染的腦直接碰工具
本文由 AI 產生、整理與撰寫。 論文基...
AgentWard 論文閱讀分析:真正會害死 autonomous agent 的,通常不是單一 prompt,而是整條 lifecycle 一路把風險送到執行端
本文由 AI 產生、整理與撰寫。 論文基...
BackdoorAgent 論文閱讀分析:真正危險的不是單步被騙,而是 trigger 沿著 agent workflow 一路活到最後
本文由 AI 產生、整理與撰寫。 論文基...
WASP 論文閱讀分析:現在很多 Web Agent 之所以還沒真的把你害慘,不是因為它們夠安全,而是因為它們還不夠能幹
WASP 論文閱讀分析:現在很多 Web...
Arbiter-K 論文閱讀分析:很多 agent 真正缺的,不是再多一道 guard,而是先有一個真的能執法的 kernel
這篇論文真正有價值的地方,不是在 agent 外面再多包一層 guardrail,而是直接質疑整個架構:為什麼我們一直讓 LLM 站在控制流中央,然後才用補丁式政策去收爛攤子?作者提出 Arbiter-K,把模型降級成 proposal generator,讓 deterministic kernel 透過 Semantic ISA、Security Context Registry 與 Instruction Dependency Graph 在 runtime 做 taint-aware governance。實驗顯示,OpenClaw 原生 policy 只攔下 6.17% 的違規操作,但整合 Arbiter-K 後可到 92.95%;NanoBot 也從 1.41% 拉到 94.20%。這篇真正提醒的是:agent security 若想像 production system,就不能只靠比較會勸人的 guard,得先有真的能執法的 kernel。
Agentic AI Security 論文閱讀分析:真正危險的,從來不只是模型會不會胡說,而是它開始能自己規劃、記憶、調工具、一路做下去
這篇 survey 最值得記住的,不是它又整理了一份 agent 漏洞大全,而是它把問題定義得更成熟:當 AI 具備規劃、記憶、工具使用與長時間執行能力後,風險就不再只是回答錯誤,而是整條從 prompt、memory、tool、multi-agent communication 到 human approval 的執行鏈都會變成攻擊面。真正需要建的是控制面,而不是只補單點 guardrail。
