MCP-DPT 論文閱讀分析：真正危險的不是哪個 MCP 工具有毒，而是整條防線根本放錯位置

2026 年 4 月 10 日

本文由 AI 產生、整理與撰寫。

論文基本資訊

論文標題：MCP-DPT: A Defense-Placement Taxonomy and Coverage Analysis for Model Context Protocol Security
來源：arXiv
年份：2026
arXiv：https://arxiv.org/abs/2604.07551
主題：MCP、Agentic Security、Defense-in-Depth、Supply Chain Security、Runtime Security、Architecture Governance

如果說最近一整串 agentic security 論文，都在提醒大家 AI agent 的風險早就不只是 prompt injection，那 MCP-DPT 真正做的事，是把這個提醒再往前推一層：光知道「哪裡會被打」還不夠，真正決定系統能不能守住的，是你到底把防線放在哪一層。

這篇 paper 很值得寫，不是因為它又多舉了幾種 MCP 攻擊，而是因為它指出了一個現在整個 MCP 討論裡最常被忽略的結構性問題：大家很會盤點攻擊，也很會做 benchmark，但對於某種風險究竟應該由 host、client、server、transport，還是 registry / supply chain 來負責防，反而一直沒有一張說得清楚的圖。

而這正是 MCP 真正麻煩的地方。它不是單一模型、單一 prompt、單一 API 的世界，而是一條由 host、SDK、server、tool metadata、transport、registry 與第三方生態一起構成的多方信任鏈。只要還把 MCP 安全想成「模型有沒有看懂惡意內容」，你就會一直把錯的問題丟給錯的層來解。

這篇論文到底想補哪個洞？

MCP-DPT 要補的洞，其實不是 attack taxonomy 本身，而是 defense placement。

近一年 MCP 安全研究其實已經很熱鬧。前面已經有 benchmark 在量工具投毒、惡意 server、multi-turn context contamination、跨 server workflow 風險，也有不少 system paper 在談 protocol-level guardrail、metadata 檢查、runtime monitoring 或 tool isolation。問題是，這些工作大多還是以「攻擊怎麼打」為中心，而不是以「這種攻擊最早應該在哪一層被攔下來」為中心。

這個差別看起來像研究 framing，但其實非常實務。因為如果你不知道某種風險本來就該在 registry 擋、在 host 編排層擋、還是在 transport 層擋，你就很容易落入一種常見錯誤：把所有問題都丟回 tool 端，或更糟，把所有問題都丟回模型自己判斷。

MCP-DPT 的核心貢獻，就是把 MCP 安全從 attack catalog 重新拉回 architectural responsibility。它要問的不是「有哪些 MCP 攻擊」，而是：這些攻擊一旦發生，哪一層最早有能力阻止？哪一層只是補救？哪些風險現在根本沒有清楚的 owner？

MCP 為什麼比一般 tool calling 更難守？

論文開宗明義就點出 MCP 和一般 prompt-only interaction 的本質差別：MCP 把大量 pre-execution artifacts 放進了控制迴路裡。

也就是說，在真正執行工具之前，模型就已經會先看到一大堆會影響決策的資訊：

tool name
natural-language description
argument schema
server-provided prompt / resource
shared context 與多輪中間產物

這些東西和傳統 API integration 很不一樣。傳統 API 的介面通常比較靜態，也偏 machine-validated；但 MCP 的一大部分控制表面，偏偏是 自然語言描述、語意線索與跨元件共享的上下文。這代表攻擊不一定要等到工具真的跑起來才開始，很多時候在模型還沒下決定前，攻擊就已經透過 metadata 與 context shaping 先把軌跡帶偏了。

也因此，MCP 的風險不只比「一般會 call tool 的 agent」更多，而是更分散、更跨層，也更容易出現責任錯置。你可能以為這是 server 惡意，實際上該補的是 host 的 orchestration policy；你可能以為這是模型不夠安全，實際上問題卡在 registry 根本沒把來源信任做好。

MCP-DPT 的關鍵方法：不是只分類攻擊，而是分類「誰該擋」

這篇論文最值得記住的，是它把 MCP 攻擊重新映射到 六個架構層，並且為每一類攻擊標出：

primary defense layer：最早、最合理、最該負責攔下來的那一層
secondary defense layer：如果前一道沒擋住，哪一層可以補救或降低傷害

這個做法很重要，因為它終於把「defense in depth」從一句口號，變成一個可以拿來討論責任分工的架構分析方法。

以 MCP 世界常見的幾種風險來看，這種分析特別有價值：

tool metadata poisoning 不該只被想成 tool 自己的問題，因為 host 在 tool selection 與 policy mediation 上也有責任。
context contamination 不只是模型被帶偏，而是 session / memory / orchestration 層對上下文隔離與 provenance 標示做得不夠。
malicious server behavior 不只是 server 壞，而是 transport、identity、attestation 與 registry vetting 都可能本來就該先出手。
registry / supply-chain risk 更不可能靠 runtime 的 prompt filter 單獨解決，因為那已經是上游信任治理失守。

換句話說，MCP-DPT 把攻擊從 exploit list，重新翻譯成 control-plane accountability map。 這比單純再多做一個 benchmark 更有後續價值，因為它直接能拿來問：我們現在的防禦到底都堆在哪？哪些層是黑洞？

論文最刺眼的發現：現在的防禦明顯太 tool-centric 了

作者做了另一件很有意思的事：不只建 taxonomy，還把既有 academic 與 industry defenses 逐一映射回這張圖，最後得到一個很不舒服、但非常合理的結論：當前 MCP 防禦分布非常不平均，而且高度偏向 tool-centric protection。

這代表什麼？意思就是現在大家最常做的防禦，仍然集中在：

工具輸入輸出檢查
metadata 風險分析
malicious tool / server 偵測
執行前後的 runtime guardrail

這些當然重要，但問題是，如果系統性的風險其實更多來自 host orchestration、transport path、registry / distribution / update pipeline，那你再怎麼把 tool 端防得很厚，也只是在風險已經進場之後才開始想辦法止血。

作者特別點出幾個長期被低估的薄弱層：

host orchestration layer：決定工具怎麼被發現、挑選、組合與授權的地方，卻常常沒有足夠的安全控制。
transport layer：多方元件間的傳遞鏈，若缺乏完整性與身份驗證，很多風險根本不是最後一跳能補救的。
registry / supply-chain layer：如果上游的 server 發布、版本更新、來源信任與審核機制薄弱，下游再努力也只是在接已經被污染的能力包。

這裡最重要的一句話，其實是論文的潛台詞：很多 MCP 的安全問題，看起來像 implementation flaw，實際上更像 architectural misalignment。

這篇論文最有價值的地方，不是再多一個 benchmark，而是把「安全責任」重新畫對

最近很多 agent security paper 都在講 trust boundary，但真正落到工程與治理現場，最常見的災難其實不是「完全沒人防」，而是「每一層都以為別層會防」。

MCP-DPT 之所以重要，就在於它把這種責任漂移明確化。當 host 認為 registry 應該 vet 好 server，registry 認為 host 會自己限制能力，tool provider 覺得 transport 會保完整性，model provider 又認為這些都是下游 integration 問題時，最後就會形成一條每一段都有局部防禦、整體卻沒有可信閉環的供應鏈。

而 MCP 的特殊之處，在於它天生就是多方系統。這意味著你不能只問某個元件有沒有漏洞，還要問：

哪一層最早能判斷這件事不該發生？
哪一層最適合持有 enforcement authority？
哪一層若失守，後面還有沒有補救空間？
哪些地方現在根本沒有 owner，只有希望模型自己聰明一點？

從這個角度看，MCP-DPT 其實做的是一種很資安、也很架構師的工作：它不是只證明風險存在，而是把風險轉譯成可分配、可審計、可治理的責任結構。

和前一波 MCP / agent security 論文相比，它多做了什麼？

如果把這篇放進最近一串相關研究裡看，位置其實很清楚。

MCPShield 比較像是在定義 MCP 的安全性質與形式化邊界：Tool Integrity、Data Confinement、Privilege Boundedness、Context Isolation。
TraceSafe 在看多步工具軌跡裡，guardrail 到底有沒有真的看懂執行過程。
SkillProbe、ShieldNet、PoisonedSkills 這些更聚焦 skill / tool 供應鏈與 runtime 流量層面的特定風險。
MCP-DPT 則是把這些零散風險重新收束成一個更高層的問題：防禦該放哪？誰該負責？現在哪些層明顯失衡？

所以它的價值不在於技術細節最炫，而在於它提供了一個很適合拿來做 roadmap 的視角。對企業、平台、agent host 作者、MCP 生態治理者來說，這篇比單一 attack demo 更有「接下來到底先補哪」的參考價值。

這篇對實務有什麼啟示？

如果順著論文往下想，幾個實務結論其實很明確。

不要再把 MCP 安全當成單一元件問題。 它本質上是跨 host、server、transport、registry 的系統安全問題。
不要把所有控制都堆在 tool runtime。 很多風險在執行前就已經發生，尤其是 metadata、schema、server-provided context 與 capability discovery 階段。
host 層需要更重的治理責任。 工具選擇、能力範圍、授權 gating、上下文隔離、跨 server workflow 編排，這些都不能只靠下游元件自律。
registry / 供應鏈層不能再當背景設施。 對 MCP 來說，上架、更新、版本信任、來源驗證，本身就是安全邊界的一部分。
防禦設計應該標出 primary 與 secondary control。 否則很多「縱深防禦」最後只是重複堆同一層，而不是補真正缺口。

這些結論有個共同核心：MCP 安全最終不是靠某個模型更乖，而是靠整條工具協作鏈有沒有被正確治理。

怎麼看這篇論文？

MCP-DPT 不是那種會靠一個誇張攻擊數字讓人驚到的論文；它更像是一篇在 MCP 生態開始快速擴張時，及時把討論從「有哪些攻擊」拉回「防線到底該畫在哪」的校正文。

它最值得記住的，不是某一個單獨 attack class，而是背後那條更成熟的安全觀：在多方協作的 agent 協議世界裡，風險管理的關鍵不只是看得到攻擊，而是先把 enforcement responsibility 放對地方。

如果這件事沒做好，MCP 生態就很容易變成現在很多新平台常見的樣子：功能越來越強、工具越來越多、整合越來越快，但真正的安全控制仍然集中在最末端、最晚介入、也最不該單獨承擔責任的那一層。

而這正是這篇論文最有力的提醒：MCP 的問題從來不只是某個 tool 有毒，而是整個協議生態裡，到底誰負責在什麼地方把毒擋下來。

MCP-DPT 論文閱讀分析：真正危險的不是哪個 MCP 工具有毒，而是整條防線根本放錯位置

論文基本資訊

這篇論文到底想補哪個洞？

MCP 為什麼比一般 tool calling 更難守？

MCP-DPT 的關鍵方法：不是只分類攻擊，而是分類「誰該擋」

論文最刺眼的發現：現在的防禦明顯太 tool-centric 了

這篇論文最有價值的地方，不是再多一個 benchmark，而是把「安全責任」重新畫對

和前一波 MCP / agent security 論文相比，它多做了什麼？

這篇對實務有什麼啟示？

怎麼看這篇論文？

發佈留言取消回覆

You may also like

近期文章

廣告

文章分類

近期留言

論文基本資訊

這篇論文到底想補哪個洞？

MCP 為什麼比一般 tool calling 更難守？

MCP-DPT 的關鍵方法：不是只分類攻擊，而是分類「誰該擋」

論文最刺眼的發現：現在的防禦明顯太 tool-centric 了

這篇論文最有價值的地方，不是再多一個 benchmark，而是把「安全責任」重新畫對

和前一波 MCP / agent security 論文相比，它多做了什麼？

這篇對實務有什麼啟示？

怎麼看這篇論文？

發佈留言 取消回覆

You may also like

CyLens 論文閱讀分析：Agentic LLM 如何重塑 Cyber Threat Intelligence

博士班生存守則：比努力更重要的，是不要死在錯的戰場上

近期文章

廣告

文章分類

近期留言

發佈留言取消回覆