Paper Survey Beyond Static Sandboxing 論文閱讀分析:真正該治理的,不只是 agent 能不能逃出沙箱,而是它一開始根本不該知道自己有那些高風險能力 Beyond Static Sandbo... 2026 年 4 月 18 日
Paper Survey Policy-Invisible Violations 論文閱讀分析:Agent 不是被騙了,而是根本看不到那個讓動作變成違規的世界狀態 論文基本資訊 論文標題:Policy-I... 2026 年 4 月 18 日