TraceScope 論文閱讀分析:很多 phishing defense 真正缺的,不是 classifier,而是先把證據逼出來
論文基本資訊 論文標題:TraceSco...
論文基本資訊 論文標題:TraceSco...
這篇論文真正有價值的地方,不是再證明 multi-agent 可以做 offensive security,而是把 agent 拓樸選型做成可比較的 benchmark:在 600 runs 裡,MAS-Indep 以 64.2% validated detection 拿下 coverage 端最佳表現,但 SAS 以 53 秒 median TTFV 與每個 validated finding 僅 0.058 美元成為效率錨點,說明多代理不是越複雜越好,真正該優化的是 observability、domain difficulty 與 coordination overhead 之間的折衝。
這篇 XSS 論文最重要的不是證明 LLM 能不能生更多混淆 payload,而是把問題拉回 runtime validity:如果生成樣本沒有在瀏覽器裡保住原攻擊行為,那多半只是在生看起來像攻擊的字串。
RuleForge 論文閱讀分析:當 C...
論文基本資訊 論文標題:Red-MIRR...
RuleForge 論文閱讀分析:當 C...
這篇論文真正重要的地方,不是再一次說 prompt injection 很危險,而是指出它已經開始和 XSS、CSRF、SQL 生成與多代理感染混成同一條攻擊鏈。當 agent 接上 web、工具與高權限工作流,問題就不再只是模型會不會被一句話帶偏,而是整條控制鏈會不會替攻擊者跨過授權邊界。
這篇論文最值得記住的重點是:在 agent 系統裡,真正危險的 prompt injection 不一定會反映在最後輸出文字上,而可能藏在自動 URL preview、metadata 擷取與工具呼叫造成的 network egress。當使用者看起來只是在請 agent 摘要網頁,敏感 runtime context 卻可能已經被分片、低噪音地往外送出。
這篇論文最值得記住的重點是:在 agent 系統裡,真正危險的 prompt injection 不一定會反映在最後輸出文字上,而可能藏在自動 URL preview、metadata 擷取與工具呼叫造成的 network egress。當使用者看起來只是在請 agent 摘要網頁,敏感 runtime context 卻可能已經被分片、低噪音地往外送出。