LLM Security

論文閱讀分析｜很多 log anomaly detection 高分之所以不可靠，可能不是模型太弱，而是 benchmark 先把「全部猜正常」包裝成了本事

論文基本資訊論文標題：Next-gen...

2026 年 4 月 18 日

論文基本資訊論文標題：Automati...

2026 年 4 月 18 日

本文由 AI 產生、整理與撰寫。論文基...

2026 年 4 月 18 日

這篇論文真正重要的地方，是把 prompt injection 從幾個大家熟悉的示範 payload，拉回成一張可量測的攻擊地圖。作者發現最耐打的往往不是最直白的攻擊，而是混淆、情緒操控、獎勵框架與複合式規避這些更像正常語言的 stealthy strategies。

2026 年 4 月 18 日

論文基本資訊論文標題：Red-MIRR...

2026 年 4 月 10 日

論文基本資訊論文標題：RAGRank:...

2026 年 4 月 6 日