2026

Hackers or Hallucinators 論文閱讀分析:當自動滲透 Agent 看起來很會打,其實也可能只是很會掰

這篇論文真正有價值的地方,是把近年的 AutoPT 熱潮從 hype 拉回工程現實。作者在統一 benchmark 下比較 13 個 framework 後指出,真正拖垮自動滲透 agent 的,常常不是工具不夠多,也不是 agent role 不夠花,而是 memory 管理、knowledge alignment 與 hallucination control 沒做好。

2026 年 4 月 18 日

Prompt Injection 2.0 論文閱讀分析:當惡意提示開始跟 XSS、CSRF 與多代理感染混在一起,問題就不再只是模型會不會聽話

這篇論文真正重要的地方,不是再一次說 prompt injection 很危險,而是指出它已經開始和 XSS、CSRF、SQL 生成與多代理感染混成同一條攻擊鏈。當 agent 接上 web、工具與高權限工作流,問題就不再只是模型會不會被一句話帶偏,而是整條控制鏈會不會替攻擊者跨過授權邊界。

2026 年 4 月 18 日