Paper Survey
2026
OpenSec 論文閱讀分析:當 Incident Response Agent 不是看不懂,而是太早動手時,SOC 該怎麼辦?
OpenSec 不再只測模型能不能做 incident response,而是直接評估它在對抗性證據與 prompt injection 下,是否知道何時該克制、不該過早 containment。
2026 年 4 月 8 日
SOC-bench 論文閱讀分析:我們終於開始認真評估多代理人 AI 的藍隊 incident response 能力了嗎?
論文基本資訊 論文標題:Design p...
2026 年 4 月 8 日
LLMs in the SOC 論文閱讀分析:真實分析師到底怎麼把 LLM 用進 Security Operations?
論文基本資訊 論文標題:LLMs in ...
2026 年 4 月 8 日
Policy-Guided Threat Hunting 論文閱讀分析:該讓 LLM 當 SOC 的大腦,還是當只處理高價值事件的後段分析官?
這篇論文把 autoencoder、DRL、LLM multi-agent triage 與 Splunk validation 串成同一條 threat hunting pipeline,核心不是讓 LLM 看全部流量,而是只處理被策略層挑出的高優先級事件。
2026 年 4 月 8 日
CyberThreat-Eval 論文閱讀分析:我們終於開始用接近真實 analyst workflow 的方式評估 CTI LLM 了嗎?
這篇論文不再只問模型會不會答 CTI 題,而是把 triage、deep search、TI drafting 三段 analyst workflow 直接做成 benchmark,檢驗 LLM 能不能真的接手真實 threat research。
2026 年 4 月 8 日
