Paper Survey Beyond Static Sandboxing 論文閱讀分析:真正該治理的,不只是 agent 能不能逃出沙箱,而是它一開始根本不該知道自己有那些高風險能力 Beyond Static Sandbo... 2026 年 4 月 18 日
Paper Survey SafeHarness 論文閱讀分析:真正該被保護的,也許不只是模型輸入輸出,而是整條 Agent execution harness 的生命週期 論文基本資訊 論文標題:SafeHarn... 2026 年 4 月 18 日