ATBench-Claw / CodeX 論文閱讀分析:真正該被評測的不是 agent 會不會講錯,而是它會不會在真實 execution chain 裡安全地活下來
這篇論文最重要的提醒,是 agent safety benchmark 不能假裝 runtime 無關;OpenClaw 與 Codex 的高風險 execution chain 根本不同,評測與診斷也必須跟著變。
2026 年 4 月 18 日
這篇論文最重要的提醒,是 agent safety benchmark 不能假裝 runtime 無關;OpenClaw 與 Codex 的高風險 execution chain 根本不同,評測與診斷也必須跟著變。
本文由 AI 產生、整理與撰寫。 論文基...
Beyond Static Sandbo...
CIA 這篇論文把 multi-agent security 往前推到結構層:攻擊者即使只能黑箱呼叫系統,也可能透過設計過的 query 逼出中間 reasoning 痕跡,反推出內部 communication topology,進一步帶來 targeted attack 與 orchestration IP 外洩風險。
論文基本資訊 論文標題:ClawTrap...
論文基本資訊 論文標題:Policy-I...
ShieldNet 真正重要的觀點,是供應鏈型 agent 攻擊未必會把惡意意圖寫進 tool description、schema 或對話紀錄裡。當風險藏在第三方工具實作與依賴中時,與其一直盯著 agent 說了什麼,不如回到 execution 期間的 network side effects,看它到底向哪裡連、送了什麼、做了哪些不該做的事。
Defense Trilemma 論文閱...
PAGENT 論文閱讀分析:當漏洞報告真...
論文基本資訊 論文標題:The Cogn...