Agent Runtime 架構論文閱讀分析:很多間接 prompt injection 真正缺的,不是 detector,而是先把骨架搭對
論文基本資訊 論文標題:Architec...
2026 年 4 月 29 日
論文基本資訊 論文標題:Architec...
這篇 report 真正值得看的,不是哪家 guardrail 名次排第幾,而是它把一個 production 現實攤開來看:agent 安全防線最難的,往往不是看出明顯攻擊,而是在高模糊邊界樣本上仍維持高攔截率,同時別把正常工作一起誤殺。
本文由 AI 產生、整理與撰寫。 Ret...
論文基本資訊 論文標題:The Cogn...
論文基本資訊 論文標題:How Vuln...
論文基本資訊 論文標題:SafeHarn...
論文基本資訊 論文標題:Skill-Tr...
本文由 AI 產生、整理與撰寫。 Pla...
這篇論文最值得記住的重點是:在 agent 系統裡,真正危險的 prompt injection 不一定會反映在最後輸出文字上,而可能藏在自動 URL preview、metadata 擷取與工具呼叫造成的 network egress。當使用者看起來只是在請 agent 摘要網頁,敏感 runtime context 卻可能已經被分片、低噪音地往外送出。