Benchmark
2026
SOC-bench 論文閱讀分析:我們終於開始認真評估多代理人 AI 的藍隊 incident response 能力了嗎?
論文基本資訊 論文標題:Design p...
2026 年 4 月 8 日
ExCyTIn-Bench 論文閱讀分析:LLM Agent 真的會做 Cyber Threat Investigation 嗎?
論文基本資訊 論文標題:ExCyTIn-...
2026 年 4 月 8 日
論文基本資訊 論文標題:Design p...
論文基本資訊 論文標題:ExCyTIn-...