論文閱讀分析|很多 log anomaly detection 高分之所以不可靠,可能不是模型太弱,而是 benchmark 先把「全部猜正常」包裝成了本事
論文基本資訊 論文標題:Next-gen...
2026 年 4 月 18 日
論文基本資訊 論文標題:Next-gen...
論文基本資訊 論文標題:Automati...
本文由 AI 產生、整理與撰寫。 論文基...
這篇論文真正重要的地方,是把 prompt injection 從幾個大家熟悉的示範 payload,拉回成一張可量測的攻擊地圖。作者發現最耐打的往往不是最直白的攻擊,而是混淆、情緒操控、獎勵框架與複合式規避這些更像正常語言的 stealthy strategies。