Tool Security

Paper Survey

Agent Audit 論文閱讀分析：真正該先掃的，不只是 prompt，而是整個 agent app 上線前早就攤在那裡的攻擊面

論文基本資訊論文標題：Agent Au...

2026 年 4 月 18 日

Paper Survey

Beyond Static Sandboxing 論文閱讀分析：真正該治理的，不只是 agent 能不能逃出沙箱，而是它一開始根本不該知道自己有那些高風險能力

Beyond Static Sandbo...

2026 年 4 月 18 日

Paper Survey

ShieldNet 論文閱讀分析：當惡意 Agent Tool 表面看起來很乾淨，真正洩漏真相的往往是它背後那串網路流量

ShieldNet 真正重要的觀點，是供應鏈型 agent 攻擊未必會把惡意意圖寫進 tool description、schema 或對話紀錄裡。當風險藏在第三方工具實作與依賴中時，與其一直盯著 agent 說了什麼，不如回到 execution 期間的 network side effects，看它到底向哪裡連、送了什麼、做了哪些不該做的事。

2026 年 4 月 18 日

Paper Survey

SafeHarness 論文閱讀分析：真正該被保護的，也許不只是模型輸入輸出，而是整條 Agent execution harness 的生命週期

論文基本資訊論文標題：SafeHarn...

2026 年 4 月 18 日

Paper Survey

MCP Client 論文閱讀分析：真正危險的不是 AI IDE 會不會寫錯，而是你以為它只是在幫你開發，其實它已經開始替外部內容執行命令

論文基本資訊論文標題：Are AI-a...

2026 年 4 月 17 日

Paper Survey

Secure Agentic Web 論文閱讀分析：當 Agent 不再只是單機執行，而是開始彼此委派、跨網域串接，安全問題就會從單點失誤變成系統性擴散

本文由 AI 產生、整理與撰寫。 Sec...

2026 年 4 月 17 日

Paper Survey

Back-Reveal 論文閱讀分析：真正麻煩的也許不是 Agent 當場被注入，而是那個會偷資料的行為早就被種進模型裡

論文基本資訊論文標題：Your LLM...

2026 年 4 月 17 日

Paper Survey

PlanGuard 論文閱讀分析：真正該防的可能不是那段髒資料本身，而是 Agent 的下一步行動有沒有開始偏離使用者原意

本文由 AI 產生、整理與撰寫。 Pla...

2026 年 4 月 17 日

Paper Survey

SkillJect 論文閱讀分析：當 Coding Agent 的 Skill 不再只是說明書，而是能被攻擊者反覆調校的高權限控制面

SkillJect 把 skill-based prompt injection 從手工 payload 提升成 trace-driven closed-loop attack：攻擊者不只在 skill 裡塞惡意意圖，還會根據 tool calls、file operations 與執行結果反覆修 payload，讓被污染的 skill 更像正常擴充、卻更穩地把 coding agent 帶往錯的行為。

2026 年 4 月 17 日

Paper Survey

Cybersecurity AI 論文閱讀分析：當 AI 資安工具開始自己打漏洞，最危險的反而可能是目標主機回給它看的那段內容

這篇論文把 prompt injection 拉進 AI-powered cybersecurity tools 的實戰場景：當 security agent 去掃描與利用惡意目標時，對方回傳的內容本身就可能變成控制訊號。作者在 14 種 attack variants 上觀察到 100% 成功率，並指出從初始接觸到 compromise 可以在 20 秒內完成。

2026 年 4 月 17 日

2026

Agent Audit 論文閱讀分析：真正該先掃的，不只是 prompt，而是整個 agent app 上線前早就攤在那裡的攻擊面

Beyond Static Sandboxing 論文閱讀分析：真正該治理的，不只是 agent 能不能逃出沙箱，而是它一開始根本不該知道自己有那些高風險能力

ShieldNet 論文閱讀分析：當惡意 Agent Tool 表面看起來很乾淨，真正洩漏真相的往往是它背後那串網路流量

SafeHarness 論文閱讀分析：真正該被保護的，也許不只是模型輸入輸出，而是整條 Agent execution harness 的生命週期

MCP Client 論文閱讀分析：真正危險的不是 AI IDE 會不會寫錯，而是你以為它只是在幫你開發，其實它已經開始替外部內容執行命令

Secure Agentic Web 論文閱讀分析：當 Agent 不再只是單機執行，而是開始彼此委派、跨網域串接，安全問題就會從單點失誤變成系統性擴散

Back-Reveal 論文閱讀分析：真正麻煩的也許不是 Agent 當場被注入，而是那個會偷資料的行為早就被種進模型裡

PlanGuard 論文閱讀分析：真正該防的可能不是那段髒資料本身，而是 Agent 的下一步行動有沒有開始偏離使用者原意

SkillJect 論文閱讀分析：當 Coding Agent 的 Skill 不再只是說明書，而是能被攻擊者反覆調校的高權限控制面

Cybersecurity AI 論文閱讀分析：當 AI 資安工具開始自己打漏洞，最危險的反而可能是目標主機回給它看的那段內容

近期文章

廣告

文章分類

近期留言