AttackSeqBench 論文閱讀分析:當 CTI 真正要幫你看懂攻擊全貌,模型就不能只會背單點知識,還得讀懂整條攻擊序列
AttackSeqBench 把 CTI benchmark 從單點知識問答往前推到 sequence-level reasoning:真正重要的不只是模型知不知道某個 ATT&CK technique,而是它能不能理解 tactic、technique 與 procedure 在真實攻擊流程中的先後、依賴與一致性。
2026 年 4 月 17 日
AttackSeqBench 把 CTI benchmark 從單點知識問答往前推到 sequence-level reasoning:真正重要的不只是模型知不知道某個 ATT&CK technique,而是它能不能理解 tactic、technique 與 procedure 在真實攻擊流程中的先後、依賴與一致性。
本文由 AI 產生、整理與撰寫。 Pro...
SIR-Bench 想補的不是另一個只看最後 triage 對不對的 benchmark,而是更接近真實 SOC 的問題:Incident Response Agent 到底有沒有真的做調查?這篇把 investigation depth 拉成核心指標,要求 agent 不只判斷 true positive / false positive,還得沿著 CloudTrail 與工具查詢,找出 alert 原本沒直接告訴你的 novel findings。
論文基本資訊 論文標題:CyberExp...
論文基本資訊 論文標題:CritBenc...
論文基本資訊 論文標題:The Syst...