Prompt Injection

Conjunctive Prompt Attacks 論文閱讀分析：真正難防的不是哪段內容特別毒，而是兩段各自都像正常話的東西在對的路由上剛好拼起來

這篇論文最值得警惕的地方，不是又多了一種 prompt injection，而是把多代理風險從單點惡意內容拉成跨代理組合條件：user query 裡看似無害的 trigger key，配上被污染 remote agent 的 hidden template，單獨都不夠可疑，但只要 routing 把它們送到同一個地方，整條 agent pipeline 就可能突然變成攻擊面。

2026 年 4 月 21 日

Paper Survey

LogJack 論文閱讀分析：真正危險的不是 log 裡有髒字串，而是 agent 可能把它當成下一步要照做的修復指令

這篇論文證明 cloud logs 本身就可能成為 indirect prompt injection 通道；一旦 debugging agent 既會讀 log 又能直接下命令，log 就可能從觀測資料變成控制入口。

2026 年 4 月 21 日

Paper Survey

Prompt Injection 偵測論文閱讀分析：真正難抓的，不是最像攻擊的那種，而是最像正常內容卻在偷改控制權的那種

這篇論文最重要的提醒，是 prompt injection 偵測不能再只靠 regex 或單一分類器，而要把 stylometry、local alignment、taint propagation 與長期 probing 訊號一起拉進來。

2026 年 4 月 21 日

Paper Survey

CapSeal 論文閱讀分析：真正成熟的 Agent，不該再把 API key 和 SSH 憑證直接抱在自己懷裡

CapSeal 這篇論文最重要的提醒，不是 agent 會不會保守秘密，而是很多系統從架構上就不該讓 agent 直接持有可外流、可重播的 bearer credential。

2026 年 4 月 21 日

Paper Survey

CASCADE 論文閱讀分析：真正能上線的 MCP 防線，往往不是最聰明的那個，而是最能把誤報、延遲、隱私與語意風險一起壓住的那個

CASCADE 這篇論文真正值得看的，不只是它做了三層 prompt injection 偵測，而是它把 MCP 防禦往可本地部署、可分層過濾、可保留人工 review 的工程化方向推進了一步。

2026 年 4 月 21 日

Paper Survey

SafeAgent 論文閱讀分析：真正能保護 agent 的，通常不是再多一道 prompt filter，而是把整條執行迴圈當成受治理系統

SafeAgent 這篇論文真正有價值的，不是再做一個更兇的 prompt guardrail，而是把 agent 安全重新定義成沿著 retrieval、tool use、memory 與 action loop 持續演化的 runtime 治理問題。

2026 年 4 月 21 日

Paper Survey

MalTool 論文閱讀分析：真正危險的不是 agent 會不會選錯工具，而是那個工具本體可能一邊正常工作、一邊偷偷做壞事

MalTool 真正補上的不是 another tool poisoning story，而是 code-level implementation 這一層：攻擊者不只可以操縱工具描述，還能用 coding LLM 大量生成一邊正常工作、一邊偷偷外洩、竄改或拖垮流程的惡意工具。對 agent 生態來說，這已經是完整的 tool supply chain 與 runtime side-effect 問題。

2026 年 4 月 21 日

Paper Survey

MCP-38 論文閱讀分析：真正該防的可能不是單一 prompt injection，而是整個 MCP 協定層長出的新攻擊面

MCP-38 這篇論文的重要性不在於再多列幾個 scary case，而是把 Model Context Protocol 特有的風險整理成一套 protocol-specific threat taxonomy。真正該防的，不只是單一 prompt injection，而是 tool description poisoning、parasitic tool chaining、dynamic trust violations 這類會沿著描述層、串接層與信任層擴散的結構性攻擊面。

2026 年 4 月 21 日

Paper Survey

SoK: The Attack Surface of Agentic AI 論文閱讀分析：真正該防的可能不是某個 prompt，而是整條從資料流走到行動流的 agent attack surface

論文基本資訊論文標題：SoK: The...

2026 年 4 月 21 日

Paper Survey

DataFilter 論文閱讀分析：真正該先清的，也許不是模型輸出，而是它吃進去的那份外部資料

本文由 AI 產生、整理與撰寫。如果最...

2026 年 4 月 18 日

2026

Conjunctive Prompt Attacks 論文閱讀分析：真正難防的不是哪段內容特別毒，而是兩段各自都像正常話的東西在對的路由上剛好拼起來

Prompt Injection 偵測論文閱讀分析：真正難抓的，不是最像攻擊的那種，而是最像正常內容卻在偷改控制權的那種

CapSeal 論文閱讀分析：真正成熟的 Agent，不該再把 API key 和 SSH 憑證直接抱在自己懷裡

CASCADE 論文閱讀分析：真正能上線的 MCP 防線，往往不是最聰明的那個，而是最能把誤報、延遲、隱私與語意風險一起壓住的那個

SafeAgent 論文閱讀分析：真正能保護 agent 的，通常不是再多一道 prompt filter，而是把整條執行迴圈當成受治理系統

MalTool 論文閱讀分析：真正危險的不是 agent 會不會選錯工具，而是那個工具本體可能一邊正常工作、一邊偷偷做壞事

MCP-38 論文閱讀分析：真正該防的可能不是單一 prompt injection，而是整個 MCP 協定層長出的新攻擊面

SoK: The Attack Surface of Agentic AI 論文閱讀分析：真正該防的可能不是某個 prompt，而是整條從資料流走到行動流的 agent attack surface

DataFilter 論文閱讀分析：真正該先清的，也許不是模型輸出，而是它吃進去的那份外部資料

近期文章

廣告

文章分類

近期留言