Paper Survey When Benchmarks Lie 論文閱讀分析:很多惡意 Prompt Detector 失敗的原因,可能不是不夠聰明,而是 benchmark 先讓你看起來太強 本文由 AI 產生、整理與撰寫。 論文基... 2026 年 4 月 18 日