Benchmark

AttackSeqBench 論文閱讀分析：當 CTI 真正要幫你看懂攻擊全貌，模型就不能只會背單點知識，還得讀懂整條攻擊序列

AttackSeqBench 把 CTI benchmark 從單點知識問答往前推到 sequence-level reasoning：真正重要的不只是模型知不知道某個 ATT&CK technique，而是它能不能理解 tactic、technique 與 procedure 在真實攻擊流程中的先後、依賴與一致性。

2026 年 4 月 17 日

Paper Survey

Prompt Injection Threat Landscape 論文閱讀分析：很多 Agent 防禦之所以看起來有效，可能只是因為它們先把真正重要的上下文一起擋掉了

本文由 AI 產生、整理與撰寫。 Pro...

2026 年 4 月 17 日

Paper Survey

SIR-Bench 論文閱讀分析：真正值得信的 IR Agent，不是會把 alert 說得更像人話，而是會自己挖出 alert 沒講的新證據

SIR-Bench 想補的不是另一個只看最後 triage 對不對的 benchmark，而是更接近真實 SOC 的問題：Incident Response Agent 到底有沒有真的做調查？這篇把 investigation depth 拉成核心指標，要求 agent 不只判斷 true positive / false positive，還得沿著 CloudTrail 與工具查詢，找出 alert 原本沒直接告訴你的 novel findings。

2026 年 4 月 17 日

Paper Survey