2026

Hackers or Hallucinators 論文閱讀分析:當自動滲透 Agent 看起來很會打,其實也可能只是很會掰

這篇論文真正有價值的地方,是把近年的 AutoPT 熱潮從 hype 拉回工程現實。作者在統一 benchmark 下比較 13 個 framework 後指出,真正拖垮自動滲透 agent 的,常常不是工具不夠多,也不是 agent role 不夠花,而是 memory 管理、knowledge alignment 與 hallucination control 沒做好。

2026 年 4 月 18 日