Agentic Security

Arbiter-K 論文閱讀分析：很多 agent 真正缺的，不是再多一道 guard，而是先有一個真的能執法的 kernel

這篇論文真正有價值的地方，不是在 agent 外面再多包一層 guardrail，而是直接質疑整個架構：為什麼我們一直讓 LLM 站在控制流中央，然後才用補丁式政策去收爛攤子？作者提出 Arbiter-K，把模型降級成 proposal generator，讓 deterministic kernel 透過 Semantic ISA、Security Context Registry 與 Instruction Dependency Graph 在 runtime 做 taint-aware governance。實驗顯示，OpenClaw 原生 policy 只攔下 6.17% 的違規操作，但整合 Arbiter-K 後可到 92.95%；NanoBot 也從 1.41% 拉到 94.20%。這篇真正提醒的是：agent security 若想像 production system，就不能只靠比較會勸人的 guard，得先有真的能執法的 kernel。

2026 年 4 月 22 日

Paper Survey

Agentic AI Security 論文閱讀分析：真正危險的，從來不只是模型會不會胡說，而是它開始能自己規劃、記憶、調工具、一路做下去

這篇 survey 最值得記住的，不是它又整理了一份 agent 漏洞大全，而是它把問題定義得更成熟：當 AI 具備規劃、記憶、工具使用與長時間執行能力後，風險就不再只是回答錯誤，而是整條從 prompt、memory、tool、multi-agent communication 到 human approval 的執行鏈都會變成攻擊面。真正需要建的是控制面，而不是只補單點 guardrail。

2026 年 4 月 22 日

Paper Survey

enclawed 論文閱讀分析：真正讓單使用者 AI gateway 比較敢碰高敏資料的，不是多一層花俏 guard，而是把整個預設值翻成拒絕優先

這篇論文真正重要的地方，不是又多一個 prompt guard，而是把單使用者 AI gateway 的 host posture 從 consumer-friendly convenience 翻成 deny-by-default、可驗簽、可審計、可回滾的硬化框架。

2026 年 4 月 22 日

Paper Survey

Visual Inception 論文閱讀分析：最危險的圖片，不一定當下就有毒，而是之後會被 Agent 自己重新想起來的那張

這篇論文最值得看的，不是它又示範了一次多模態攻擊，而是它證明：在會保存長期記憶、之後再拿來做規劃的 agent 系統裡，一張今天看起來正常的圖片，也能變成明天悄悄接管推薦方向的 sleeper agent。真正的風險，不只是輸入有毒，而是有毒輸入被你收進記憶之後，還會被系統自己重新想起來。

2026 年 4 月 22 日

Paper Survey

SoK: The Attack Surface of Agentic AI 論文閱讀分析：真正該防的可能不是某個 prompt，而是整條從資料流走到行動流的 agent attack surface

論文基本資訊論文標題：SoK: The...

2026 年 4 月 21 日

Paper Survey

長期記憶安全論文閱讀分析：很多 Agent 真正最危險的，不是當下被騙，而是被騙過的東西還會一直留在腦子裡

這篇論文真正重要的，不是再多列幾種 memory attack，而是把長期記憶重新定義成 agent 的 state-governance 問題：可寫、可取回、可共享、可遺忘的 memory，本身就是獨立安全邊界。

2026 年 4 月 21 日

Paper Survey

Anumati 論文閱讀分析：當 Agent 開始替你接受別人的條款，真正該驗的就不只是有沒有權限呼叫

Anumati 真正要補的，不是再多一層身份驗證，而是 agent 在呼叫別的 agent 或工具前後，能不能留下可版本化、可審計、逐行動可追責的 consent 與 adherence 證據。

2026 年 4 月 21 日

Paper Survey

Symbolic Guardrails 論文閱讀分析：很多高風險 agent 真正缺的，不是更會想，而是先把不該做的事硬鎖住

這篇論文真正補到的，不是再發明一個更聰明的 guard model，而是把高風險 agent 裡那些本來就能形式化的政策，從 prompt 與常識判斷裡抽出來，改成可驗證、可審計、可在執行時硬鎖住的 symbolic guardrails。

2026 年 4 月 21 日

Paper Survey

HarmfulSkillBench 論文閱讀分析：真正危險的 skill，未必會偷你的資料，它也可能只是把壞事包成一鍵可裝的能力

這篇論文真正補上的，不是 skill 裡有沒有 prompt injection，而是另一個更容易被低估的面向：如果 skill 本身的 intended functionality 就是 cyber attack、詐欺、隱私侵犯或高風險決策自動化，那 agent 其實是在被公開 skill 生態系統化地武裝。

2026 年 4 月 21 日

Paper Survey

Governed MCP 論文閱讀分析：真正撐住 Agent 工具安全的，可能不是再多一層 wrapper，而是把治理點直接釘進 kernel

這篇論文把 agent 工具安全的問題講得很到位：真正需要防的不是多一個 userspace wrapper，而是把每次 MCP tool invocation 當成 privileged syscall，交給不可旁路的 kernel-level governance gateway 去接住。

2026 年 4 月 21 日

2026

Arbiter-K 論文閱讀分析：很多 agent 真正缺的，不是再多一道 guard，而是先有一個真的能執法的 kernel

Agentic AI Security 論文閱讀分析：真正危險的，從來不只是模型會不會胡說，而是它開始能自己規劃、記憶、調工具、一路做下去

enclawed 論文閱讀分析：真正讓單使用者 AI gateway 比較敢碰高敏資料的，不是多一層花俏 guard，而是把整個預設值翻成拒絕優先

Visual Inception 論文閱讀分析：最危險的圖片，不一定當下就有毒，而是之後會被 Agent 自己重新想起來的那張

SoK: The Attack Surface of Agentic AI 論文閱讀分析：真正該防的可能不是某個 prompt，而是整條從資料流走到行動流的 agent attack surface

長期記憶安全論文閱讀分析：很多 Agent 真正最危險的，不是當下被騙，而是被騙過的東西還會一直留在腦子裡

Symbolic Guardrails 論文閱讀分析：很多高風險 agent 真正缺的，不是更會想，而是先把不該做的事硬鎖住

HarmfulSkillBench 論文閱讀分析：真正危險的 skill，未必會偷你的資料，它也可能只是把壞事包成一鍵可裝的能力

Governed MCP 論文閱讀分析：真正撐住 Agent 工具安全的，可能不是再多一層 wrapper，而是把治理點直接釘進 kernel

近期文章

廣告

文章分類

近期留言