Visual Inception 論文閱讀分析:最危險的圖片,不一定當下就有毒,而是之後會被 Agent 自己重新想起來的那張
這篇論文最值得看的,不是它又示範了一次多模態攻擊,而是它證明:在會保存長期記憶、之後再拿來做規劃的 agent 系統裡,一張今天看起來正常的圖片,也能變成明天悄悄接管推薦方向的 sleeper agent。真正的風險,不只是輸入有毒,而是有毒輸入被你收進記憶之後,還會被系統自己重新想起來。
這篇論文最值得看的,不是它又示範了一次多模態攻擊,而是它證明:在會保存長期記憶、之後再拿來做規劃的 agent 系統裡,一張今天看起來正常的圖片,也能變成明天悄悄接管推薦方向的 sleeper agent。真正的風險,不只是輸入有毒,而是有毒輸入被你收進記憶之後,還會被系統自己重新想起來。
論文基本資訊 論文標題:SoK: The...
這篇論文真正提醒業界的,不是模型權重會不會被翻位,而是共享 prefix KV-cache 一旦發生 silent corruption,傷害可能沿著同一條 prompt path 持續累積;關鍵補件不是更聰明的模型,而是放對位置的完整性驗證。
這篇論文把 agent 工具安全的問題講得很到位:真正需要防的不是多一個 userspace wrapper,而是把每次 MCP tool invocation 當成 privileged syscall,交給不可旁路的 kernel-level governance gateway 去接住。
MCP-38 這篇論文的重要性不在於再多列幾個 scary case,而是把 Model Context Protocol 特有的風險整理成一套 protocol-specific threat taxonomy。真正該防的,不只是單一 prompt injection,而是 tool description poisoning、parasitic tool chaining、dynamic trust violations 這類會沿著描述層、串接層與信任層擴散的結構性攻擊面。
論文基本資訊 論文標題:SoK: The...