Prompt Injection

2026

Conjunctive Prompt Attacks 論文閱讀分析:真正難防的不是哪段內容特別毒,而是兩段各自都像正常話的東西在對的路由上剛好拼起來

這篇論文最值得警惕的地方,不是又多了一種 prompt injection,而是把多代理風險從單點惡意內容拉成跨代理組合條件:user query 裡看似無害的 trigger key,配上被污染 remote agent 的 hidden template,單獨都不夠可疑,但只要 routing 把它們送到同一個地方,整條 agent pipeline 就可能突然變成攻擊面。

2026 年 4 月 21 日

MalTool 論文閱讀分析:真正危險的不是 agent 會不會選錯工具,而是那個工具本體可能一邊正常工作、一邊偷偷做壞事

MalTool 真正補上的不是 another tool poisoning story,而是 code-level implementation 這一層:攻擊者不只可以操縱工具描述,還能用 coding LLM 大量生成一邊正常工作、一邊偷偷外洩、竄改或拖垮流程的惡意工具。對 agent 生態來說,這已經是完整的 tool supply chain 與 runtime side-effect 問題。

2026 年 4 月 21 日

MCP-38 論文閱讀分析:真正該防的可能不是單一 prompt injection,而是整個 MCP 協定層長出的新攻擊面

MCP-38 這篇論文的重要性不在於再多列幾個 scary case,而是把 Model Context Protocol 特有的風險整理成一套 protocol-specific threat taxonomy。真正該防的,不只是單一 prompt injection,而是 tool description poisoning、parasitic tool chaining、dynamic trust violations 這類會沿著描述層、串接層與信任層擴散的結構性攻擊面。

2026 年 4 月 21 日