Mastiporuto Senia

CyberMetric 論文閱讀分析：當你評估 LLM 資安能力前，得先有一個像樣的 benchmark

CyberMetric 不只是又一個資安題庫，而是用 RAG 建題、多模型過濾與 200+ 小時人工驗證，嘗試回答更底層的問題：在談 CTI、SOC 與 incident response 之前，我們究竟該如何公平評估 LLM 的廣義資安知識能力。

2026 年 4 月 8 日

Paper Survey

LLMs in the SOC 論文閱讀分析：真實 SOC 分析師究竟怎麼與 LLM 協作？

這篇研究不是再做一個 SOC agent demo，而是分析 45 位 SOC 分析師在 10 個月內的 3090 筆真實查詢，回答一個更重要的問題：LLM 在安全營運中心裡，究竟是決策者、寫作助手，還是即時的認知輔助工具。

2026 年 4 月 8 日

Paper Survey

CyberAlly 論文閱讀分析：把 Knowledge Graph 與 LLM 真的放進藍隊 Incident Response 工作流

論文基本資訊論文標題：CyberAll...

2026 年 4 月 8 日

Paper Survey

CyberRAG 論文閱讀分析：用 Agentic RAG 做攻擊分類、解釋與報告生成

論文基本資訊論文標題：CyberRAG...

2026 年 4 月 8 日

未分類

LRCTI 論文閱讀分析：如何讓 LLM 真的學會驗證 CTI 真偽？

論文基本資訊論文標題：A Large ...

2026 年 4 月 8 日

未分類

論文閱讀分析｜CyberSOCEval：LLM 在惡意程式分析與威脅情資推理上，到底做得多好？

CyberSOCEval 不是在測模型會不會背資安知識，而是在測它能不能讀懂 malware detonation 資料與 threat intelligence report。論文結果很清楚：現在的 LLM 已經有能力，但離可靠自動化 SOC 核心工作，還有很大距離。

2026 年 4 月 8 日

Paper Survey

CyberMetric 論文閱讀分析：用 RAG 與人工驗證打造廣義資安知識 benchmark

論文基本資訊論文標題：CyberMet...

2026 年 4 月 8 日

Paper Survey

CTI-REALM 論文閱讀分析：LLM Agent 真的能把威脅情報寫成偵測規則嗎？

論文基本資訊論文標題：CTI-REAL...

2026 年 4 月 8 日

Paper Survey

ExCyTIn-Bench 論文閱讀分析：LLM Agent 真的會做 Cyber Threat Investigation 嗎？

論文基本資訊論文標題：ExCyTIn-...

2026 年 4 月 8 日

未分類

FALCON 論文閱讀分析：用 Agentic LLM 從 CTI 自動生成可部署的 IDS 規則

FALCON 提出一條更接近 SOC 現場的 CTI 自動化路線：不是只用 LLM 看懂威脅情資，而是透過檢索、生成、語法／語意／效能驗證，把 CTI 直接轉成可部署的 Snort 與 YARA 規則。

2026 年 4 月 8 日

2026

CyberMetric 論文閱讀分析：當你評估 LLM 資安能力前，得先有一個像樣的 benchmark

LLMs in the SOC 論文閱讀分析：真實 SOC 分析師究竟怎麼與 LLM 協作？

CyberAlly 論文閱讀分析：把 Knowledge Graph 與 LLM 真的放進藍隊 Incident Response 工作流

CyberRAG 論文閱讀分析：用 Agentic RAG 做攻擊分類、解釋與報告生成

LRCTI 論文閱讀分析：如何讓 LLM 真的學會驗證 CTI 真偽？

論文閱讀分析｜CyberSOCEval：LLM 在惡意程式分析與威脅情資推理上，到底做得多好？

CyberMetric 論文閱讀分析：用 RAG 與人工驗證打造廣義資安知識 benchmark

CTI-REALM 論文閱讀分析：LLM Agent 真的能把威脅情報寫成偵測規則嗎？

ExCyTIn-Bench 論文閱讀分析：LLM Agent 真的會做 Cyber Threat Investigation 嗎？

FALCON 論文閱讀分析：用 Agentic LLM 從 CTI 自動生成可部署的 IDS 規則

近期文章

廣告

文章分類

近期留言