Agentic AI

SnapGuard 論文閱讀分析：很多 screenshot-based web agent 真正缺的，不是更大的模型，而是先有夠快的第一道守門員

這篇論文真正補到的，不是再提醒一次 web agent 會被頁面上的惡意指令帶偏，而是把問題切到 screenshot-based agent 的真實痛點：當模型看到的是整張被渲染過的畫面時，text-only guardrail 常常不夠，而每一步都丟大 VLM 又太重。作者提出 SnapGuard，用視覺穩定性與 action-oriented 文字訊號做輕量級多模態檢測，重點不是追求完美，而是替 browser agent 補上一個夠快、夠便宜、能先攔下可疑畫面的第一道守門員。

2026 年 4 月 29 日

Paper Survey

Multi-Agent Security 論文閱讀分析：很多系統一拆成多個 agent，真正被拆掉的不是風險，而是拒絕能力

這篇論文最值得看的，不是它又證明 multi-agent 會出事，而是它把問題精準拉回角色分工、通訊拓樸與記憶可見性：同一個模型只要換一種 orchestration，原本會在 planning 階段拒絕的有害任務，就可能被拆成一串局部合理的步驟一路做完。

2026 年 4 月 29 日

Paper Survey

AutoRISE 論文閱讀分析：很多 LLM red teaming 真正缺的，不是再多一條 prompt，而是讓攻擊策略自己進化

這篇論文真正麻煩的地方，不是又多了幾句會 jailbreak 的 prompt，而是把 automated red teaming 從「改寫提示詞」往上抬成「改寫整個攻擊策略程式」。AutoRISE 讓 coding agent 直接編輯 strategy.py，根據固定 evaluation harness 回傳的成功率、多樣性、新穎性與覆蓋率訊號持續演化 attack pipeline。對防守方來說，這提醒我們真正要面對的可能已經不是 prompt collection，而是會自己換打法的攻擊者。

2026 年 4 月 29 日

Paper Survey

Dynamic Cyber Ranges 論文閱讀分析：很多 AI 攻防評測真正缺的，不是更大的靶場，而是會還手的 defender

本文由 AI 產生、整理與撰寫。論文基...

2026 年 4 月 28 日

Paper Survey

AgentSOC 論文閱讀分析：很多 SOC AI 真正卡住的，不是看不懂告警，而是不敢替你做下一步判斷

這篇論文真正想補的，不是再做一個會摘要 SOC 告警的 copilot，而是把 perception、anticipatory reasoning 與 risk-based action planning 串成同一條 operational loop，讓安全營運從看懂事件進一步走到比較敢用、也比較不容易亂出手的回應建議。

2026 年 4 月 23 日

Paper Survey

Conjunctive Prompt Attacks 論文閱讀分析：真正難防的不是哪段內容特別毒，而是兩段各自都像正常話的東西在對的路由上剛好拼起來

這篇論文最值得警惕的地方，不是又多了一種 prompt injection，而是把多代理風險從單點惡意內容拉成跨代理組合條件：user query 裡看似無害的 trigger key，配上被污染 remote agent 的 hidden template，單獨都不夠可疑，但只要 routing 把它們送到同一個地方，整條 agent pipeline 就可能突然變成攻擊面。

2026 年 4 月 21 日

Paper Survey

Aether 論文閱讀分析：真正該自動化的，常常不是寫設定本身，而是每次網路變更前那段最怕出事的驗證流程

Aether 這篇論文真正值得看的，不只是它用了多代理，而是它把 network change validation 這件最花時間、最容易出事的工作，綁進一個以 digital twin 為共同世界模型的 verification / simulation / testing 閉環。

2026 年 4 月 21 日

Paper Survey

Can Agents Secure Hardware? 論文閱讀分析：當 Agent 開始替你自動長出硬體保護機制，真正該驗的就不只是它有沒有做出來，而是攻擊者拆不拆得掉

這篇論文最值得記住的重點是：在硬體 IP obfuscation 這種高風險安全設計問題裡，agent 能把 planning、lock-plan generation、deterministic compilation、functional verification 與 SAT-based evaluation 串成工作流，確實開始有用了；但只要 SAT solver 仍能全面恢復正確 key，這種「會生成安全機制」和「真的生成了安全性」就還是兩回事。

2026 年 4 月 17 日

Paper Survey

Hackers or Hallucinators 論文閱讀分析：為什麼很多 LLM 自動滲透代理，看起來像 hacker，做起來卻更像 hallucination machine？

論文基本資訊論文標題：Hackers ...

2026 年 4 月 10 日

Paper Survey

Red-MIRROR 論文閱讀分析：當自動化滲透測試不再只是會打，而是會記、會驗、會反省

論文基本資訊論文標題：Red-MIRR...

2026 年 4 月 10 日

2026

SnapGuard 論文閱讀分析：很多 screenshot-based web agent 真正缺的，不是更大的模型，而是先有夠快的第一道守門員

Multi-Agent Security 論文閱讀分析：很多系統一拆成多個 agent，真正被拆掉的不是風險，而是拒絕能力

AutoRISE 論文閱讀分析：很多 LLM red teaming 真正缺的，不是再多一條 prompt，而是讓攻擊策略自己進化

Dynamic Cyber Ranges 論文閱讀分析：很多 AI 攻防評測真正缺的，不是更大的靶場，而是會還手的 defender

AgentSOC 論文閱讀分析：很多 SOC AI 真正卡住的，不是看不懂告警，而是不敢替你做下一步判斷

Conjunctive Prompt Attacks 論文閱讀分析：真正難防的不是哪段內容特別毒，而是兩段各自都像正常話的東西在對的路由上剛好拼起來

Aether 論文閱讀分析：真正該自動化的，常常不是寫設定本身，而是每次網路變更前那段最怕出事的驗證流程

Can Agents Secure Hardware? 論文閱讀分析：當 Agent 開始替你自動長出硬體保護機制，真正該驗的就不只是它有沒有做出來，而是攻擊者拆不拆得掉

Hackers or Hallucinators 論文閱讀分析：為什麼很多 LLM 自動滲透代理，看起來像 hacker，做起來卻更像 hallucination machine？

Red-MIRROR 論文閱讀分析：當自動化滲透測試不再只是會打，而是會記、會驗、會反省

近期文章

廣告

文章分類

近期留言