近期文章
- Agent Privilege Separation in OpenClaw 論文閱讀分析:真正該切開的不是 prompt,而是那條讓髒內容直接碰到高權限工具的路
- OS-BLIND 論文閱讀分析:真正危險的,不一定是惡意指令,而是 agent 在看起來正常的任務裡一路把事情做壞了
- ATBench-Claw / CodeX 論文閱讀分析:真正該被評測的不是 agent 會不會講錯,而是它會不會在真實 execution chain 裡安全地活下來
- Proactively Detecting Threats 論文閱讀分析:真正拖慢防守的,常常不是黑名單不夠多,而是 threat report 剛出現時根本還沒人先把可用 IOC 撈出來
- Beyond Static Sandboxing 論文閱讀分析:真正該治理的,不只是 agent 能不能逃出沙箱,而是它一開始根本不該知道自己有那些高風險能力
