Agentic Security

SkillJect 把 skill-based prompt injection 從手工 payload 提升成 trace-driven closed-loop attack：攻擊者不只在 skill 裡塞惡意意圖，還會根據 tool calls、file operations 與執行結果反覆修 payload，讓被污染的 skill 更像正常擴充、卻更穩地把 coding agent 帶往錯的行為。

2026 年 4 月 17 日

Paper Survey

Cybersecurity AI 論文閱讀分析：當 AI 資安工具開始自己打漏洞，最危險的反而可能是目標主機回給它看的那段內容

這篇論文把 prompt injection 拉進 AI-powered cybersecurity tools 的實戰場景：當 security agent 去掃描與利用惡意目標時，對方回傳的內容本身就可能變成控制訊號。作者在 14 種 attack variants 上觀察到 100% 成功率，並指出從初始接觸到 compromise 可以在 20 秒內完成。

2026 年 4 月 17 日

Paper Survey

MCPThreatHive 論文閱讀分析：當 MCP 生態開始爆量成長，真正缺的就不只是 scanner，而是一套活的威脅情報底座

MCPThreatHive 的重點不是再做一個單點防禦，而是把 MCP threat intelligence 做成持續運轉的基礎設施：從情報蒐集、LLM 分析、MCP-38/OWASP/STRIDE 對映、知識圖譜，到風險排序與視覺化，補上現有 MCP 安全工具在組合攻擊建模、持續更新與跨框架翻譯上的缺口。

2026 年 4 月 17 日

Paper Survey

AutoInject 論文閱讀分析：當 Prompt Injection 開始自己學會怎麼攻擊，防線就不能再假設對手只會手工拼字串

AutoInject 這篇論文最值得注意的，不是它又做出一個 prompt injection 範例，而是它把攻擊從人工 red teaming 推進成可被強化學習最佳化的自動化程序。當 adversarial suffix 能被系統化搜尋、又能跨模型與任務遷移時，很多仰賴固定模板與靜態字串規則的 agent 防線，就會開始撐不住。

2026 年 4 月 17 日

Paper Survey

WebAgentGuard 論文閱讀分析：當 Web Agent 真正需要的，不是更長的提示詞，而是一個會先說「先別動」的平行 Guard

這篇論文真正往前推的一點，是把 web agent 的安全判斷從主 agent 的 task reasoning 裡拆出來，變成一個平行運作的 guard model。它不只是再補一句 system prompt，而是在每一步 action 落地前，先讓另一個多模態 guard 檢查 HTML、screenshot 與使用者目標之間是否出現 prompt injection 風險。

2026 年 4 月 17 日

Paper Survey

Silent Egress 論文閱讀分析：當 Agent 看起來什麼都沒說錯，資料卻可能早就在你沒注意的那一步悄悄送出去了

這篇論文最值得記住的重點是：在 agent 系統裡，真正危險的 prompt injection 不一定會反映在最後輸出文字上，而可能藏在自動 URL preview、metadata 擷取與工具呼叫造成的 network egress。當使用者看起來只是在請 agent 摘要網頁，敏感 runtime context 卻可能已經被分片、低噪音地往外送出。

2026 年 4 月 17 日

2026

MCP Client 論文閱讀分析：真正危險的不是 AI IDE 會不會寫錯，而是你以為它只是在幫你開發，其實它已經開始替外部內容執行命令

Back-Reveal 論文閱讀分析：真正麻煩的也許不是 Agent 當場被注入，而是那個會偷資料的行為早就被種進模型裡

PlanGuard 論文閱讀分析：真正該防的可能不是那段髒資料本身，而是 Agent 的下一步行動有沒有開始偏離使用者原意

Prompt Injection Threat Landscape 論文閱讀分析：很多 Agent 防禦之所以看起來有效，可能只是因為它們先把真正重要的上下文一起擋掉了

SkillJect 論文閱讀分析：當 Coding Agent 的 Skill 不再只是說明書，而是能被攻擊者反覆調校的高權限控制面

Cybersecurity AI 論文閱讀分析：當 AI 資安工具開始自己打漏洞，最危險的反而可能是目標主機回給它看的那段內容

MCPThreatHive 論文閱讀分析：當 MCP 生態開始爆量成長，真正缺的就不只是 scanner，而是一套活的威脅情報底座

AutoInject 論文閱讀分析：當 Prompt Injection 開始自己學會怎麼攻擊，防線就不能再假設對手只會手工拼字串

WebAgentGuard 論文閱讀分析：當 Web Agent 真正需要的，不是更長的提示詞，而是一個會先說「先別動」的平行 Guard

Silent Egress 論文閱讀分析：當 Agent 看起來什麼都沒說錯，資料卻可能早就在你沒注意的那一步悄悄送出去了

近期文章

廣告

文章分類

近期留言