Tool Abuse

這篇 report 真正值得看的，不是哪家 guardrail 名次排第幾，而是它把一個 production 現實攤開來看：agent 安全防線最難的，往往不是看出明顯攻擊，而是在高模糊邊界樣本上仍維持高攔截率，同時別把正常工作一起誤殺。

2026 年 4 月 29 日

AI Agent Guardrails 論文閱讀分析：很多防線真正缺的，不是更會喊危險，而是別把正常工作一起掐死