Paper Survey

SIR-Bench 想補的不是另一個只看最後 triage 對不對的 benchmark，而是更接近真實 SOC 的問題：Incident Response Agent 到底有沒有真的做調查？這篇把 investigation depth 拉成核心指標，要求 agent 不只判斷 true positive / false positive，還得沿著 CloudTrail 與工具查詢，找出 alert 原本沒直接告訴你的 novel findings。

2026 年 4 月 17 日

Paper Survey

SkillJect 論文閱讀分析：當 Coding Agent 的 Skill 不再只是說明書，而是能被攻擊者反覆調校的高權限控制面

SkillJect 把 skill-based prompt injection 從手工 payload 提升成 trace-driven closed-loop attack：攻擊者不只在 skill 裡塞惡意意圖，還會根據 tool calls、file operations 與執行結果反覆修 payload，讓被污染的 skill 更像正常擴充、卻更穩地把 coding agent 帶往錯的行為。

2026 年 4 月 17 日

Paper Survey

ADAM 論文閱讀分析：當 Agent 真的把你記住，攻擊者也可能學會怎麼把那些記憶一點一點問出來

ADAM 把 agent memory 風險從偶發外洩，推進成一條會估計記憶分布、依前一輪回應自我調整、逐步最大化 privacy leakage 的 adaptive extraction attack，提醒我們 memory 應被當成資料平面而不是單純上下文增強層來保護。

2026 年 4 月 17 日

Paper Survey

Cybersecurity AI 論文閱讀分析：當 AI 資安工具開始自己打漏洞，最危險的反而可能是目標主機回給它看的那段內容

這篇論文把 prompt injection 拉進 AI-powered cybersecurity tools 的實戰場景：當 security agent 去掃描與利用惡意目標時，對方回傳的內容本身就可能變成控制訊號。作者在 14 種 attack variants 上觀察到 100% 成功率，並指出從初始接觸到 compromise 可以在 20 秒內完成。

2026 年 4 月 17 日

Paper Survey

SOC × LLM 論文閱讀分析：大家不是不用 AI，而是不敢把高風險收尾真的交給它

這篇研究用 Reddit 上三個資安社群、892 則討論，拆開真實 SOC 現場如何使用、理解與保留 LLM。最關鍵的結論不是「大家不用 AI」，而是大家主要把它放在低風險、可驗證、能保留人類主導權的任務上；真正阻礙高自治導入的，是可靠性、驗證成本、隱私風險與責任邊界。

2026 年 4 月 17 日

Paper Survey

MCPThreatHive 論文閱讀分析：當 MCP 生態開始爆量成長，真正缺的就不只是 scanner，而是一套活的威脅情報底座

MCPThreatHive 的重點不是再做一個單點防禦，而是把 MCP threat intelligence 做成持續運轉的基礎設施：從情報蒐集、LLM 分析、MCP-38/OWASP/STRIDE 對映、知識圖譜，到風險排序與視覺化，補上現有 MCP 安全工具在組合攻擊建模、持續更新與跨框架翻譯上的缺口。

2026 年 4 月 17 日

2026

Secure Agentic Web 論文閱讀分析：當 Agent 不再只是單機執行，而是開始彼此委派、跨網域串接，安全問題就會從單點失誤變成系統性擴散

Back-Reveal 論文閱讀分析：真正麻煩的也許不是 Agent 當場被注入，而是那個會偷資料的行為早就被種進模型裡

PlanGuard 論文閱讀分析：真正該防的可能不是那段髒資料本身，而是 Agent 的下一步行動有沒有開始偏離使用者原意

Prompt Injection Threat Landscape 論文閱讀分析：很多 Agent 防禦之所以看起來有效，可能只是因為它們先把真正重要的上下文一起擋掉了

SkillJect 論文閱讀分析：當 Coding Agent 的 Skill 不再只是說明書，而是能被攻擊者反覆調校的高權限控制面

ADAM 論文閱讀分析：當 Agent 真的把你記住，攻擊者也可能學會怎麼把那些記憶一點一點問出來

Cybersecurity AI 論文閱讀分析：當 AI 資安工具開始自己打漏洞，最危險的反而可能是目標主機回給它看的那段內容

SOC × LLM 論文閱讀分析：大家不是不用 AI，而是不敢把高風險收尾真的交給它

MCPThreatHive 論文閱讀分析：當 MCP 生態開始爆量成長，真正缺的就不只是 scanner，而是一套活的威脅情報底座

近期文章

廣告

文章分類

近期留言