SecTools.tw 2.0 – 第 34 頁 – Empowering Your Cybersecurity, One Tool at a Time.

Paper Survey

ARTEMIS 論文閱讀分析：當 AI Agent 開始在真實企業網路裡打滲透測試，評測就不能再只看 CTF

這篇論文真正重要的，不是 AI 又贏了幾個 benchmark，而是它第一次比較完整地證明：設計得夠好的 agent scaffold，已經能在真實大型企業網路裡逼近甚至超過大多數專業滲透測試員。

2026 年 4 月 10 日

Paper Survey

SkillProbe 論文閱讀分析：當 Agent Skill Marketplace 真正危險的，不是壞工具，而是會互相放大風險的好工具

這篇論文真正重要的，不是又做一個多代理稽核框架，而是把 skill marketplace 的核心風險講白：問題不只在單一 skill 有沒有毒，而在語意信任如何一路被放大成執行權限與跨 skill 連鎖風險。

2026 年 4 月 10 日

Paper Survey

AI-Driven Multi-Agent Cyber Range 論文閱讀分析：當資安 Agent 真正要上場前，先問你的演練場到底夠不夠真

這篇論文真正重要的不是又做一個自動化 incident response demo，而是把 cyber range 從靜態劇本推向會互相影響的攻防 feedback loop：攻擊會調整、防守會回應，環境也會跟著變。

2026 年 4 月 10 日

Paper Survey

TraceSafe 論文閱讀分析：當 AI Agent 的風險不在最後一句，而是藏在整條工具呼叫軌跡裡

TraceSafe 這篇論文把 agent 安全的焦點從最終回答拉到中途 execution trace，提出 TraceSafe-Bench 來評估 guardrails 在多步工具呼叫軌跡中能否辨識 prompt injection、privacy leakage、hallucination 與 interface inconsistency 等風險。

2026 年 4 月 10 日

Paper Survey

MCPShield 論文閱讀分析：當 AI Agent 開始用 MCP 接世界，真正該驗的就不只是 Prompt，而是整條工具互動鏈

MCPShield 這篇論文想補的不是又一個 MCP 攻擊案例，而是整個 MCP 安全領域缺的共同語言：它把 23 種 attack vectors 收束成統一 taxonomy，並把工具完整性、資料侷限、權限邊界與 context isolation 寫成可驗證的安全性質。

2026 年 4 月 10 日

Paper Survey

The Autonomy Tax 論文閱讀分析：當你把 LLM Agent 防得更安全，為什麼它反而先失去行動能力？

The Autonomy Tax 指出一個 agent security 很尷尬但很真實的問題：很多 prompt injection defense training 並沒有真的讓 agent 更安全，而是讓它更容易在 benign 任務上失能、卡進 retry loop，甚至在面對包裝過的攻擊時仍照樣被繞過。

2026 年 4 月 10 日

Paper Survey

AgentAuditor 論文閱讀分析：當 AI Agent 開始自己做事，真正該補強的可能是那個負責判它風險的 Judge

AgentAuditor 把焦點拉到常被忽略的一層：當 agent safety / security 開始依賴 LLM judge 來判斷多步驟行為是否越界，真正的風險不只在 agent 本身，也在那個負責評價它的 evaluator 是否夠像專家。

2026 年 4 月 10 日

Paper Survey

Causality Laundering 論文閱讀分析：當 Agent 沒拿到資料，卻還是能從「被拒絕」裡把情報洗出去

這篇論文最重要的提醒是：在 tool-calling agent 裡，危險不只來自成功讀到敏感資料，也可能來自 denied action 本身帶出的推論訊號。真正該管的不是單一工具呼叫，而是整條由 deny feedback 影響後續行為的因果執行鏈。

2026 年 4 月 10 日

Paper Survey

Mapping the Exploitation Surface 論文閱讀分析：真正把 Agent 推去找洞的，往往不是違規指令，而是被改寫的任務框架

這篇論文最有價值的地方，不是再展示一次 agent 會 exploit，而是用近一萬次試驗把 exploitation surface 縮小成更能操作的 threat model：多數直覺上的 prompt 操弄其實沒有效，真正危險的是會把 exploit 重寫成任務求解流程的 goal reframing。

2026 年 4 月 10 日

Paper Survey

Beyond Single Reports 論文閱讀分析：當 CTI 自動化還只看單篇報告，它離真正的 campaign intelligence 還差很遠

這篇論文最重要的提醒，是大型攻擊活動本來就不是靠單一 CTI 報告被理解的；如果 ATT&CK technique extraction 還停在 single-report evaluation，就很容易高估模型能力、低估 downstream control coverage 的缺口。

2026 年 4 月 10 日

2026

ARTEMIS 論文閱讀分析：當 AI Agent 開始在真實企業網路裡打滲透測試，評測就不能再只看 CTF

SkillProbe 論文閱讀分析：當 Agent Skill Marketplace 真正危險的，不是壞工具，而是會互相放大風險的好工具

AI-Driven Multi-Agent Cyber Range 論文閱讀分析：當資安 Agent 真正要上場前，先問你的演練場到底夠不夠真

TraceSafe 論文閱讀分析：當 AI Agent 的風險不在最後一句，而是藏在整條工具呼叫軌跡裡

MCPShield 論文閱讀分析：當 AI Agent 開始用 MCP 接世界，真正該驗的就不只是 Prompt，而是整條工具互動鏈

The Autonomy Tax 論文閱讀分析：當你把 LLM Agent 防得更安全，為什麼它反而先失去行動能力？

AgentAuditor 論文閱讀分析：當 AI Agent 開始自己做事，真正該補強的可能是那個負責判它風險的 Judge

Causality Laundering 論文閱讀分析：當 Agent 沒拿到資料，卻還是能從「被拒絕」裡把情報洗出去

Mapping the Exploitation Surface 論文閱讀分析：真正把 Agent 推去找洞的，往往不是違規指令，而是被改寫的任務框架

Beyond Single Reports 論文閱讀分析：當 CTI 自動化還只看單篇報告，它離真正的 campaign intelligence 還差很遠

近期文章

廣告

文章分類

近期留言