Agent Architecture

2026

Offensive Security Agent 架構論文閱讀分析:很多系統真正缺的,不是再多幾個分身,而是先知道什麼時候單兵就夠

這篇論文真正有價值的地方,不是再證明 multi-agent 可以做 offensive security,而是把 agent 拓樸選型做成可比較的 benchmark:在 600 runs 裡,MAS-Indep 以 64.2% validated detection 拿下 coverage 端最佳表現,但 SAS 以 53 秒 median TTFV 與每個 validated finding 僅 0.058 美元成為效率錨點,說明多代理不是越複雜越好,真正該優化的是 observability、domain difficulty 與 coordination overhead 之間的折衝。

2026 年 4 月 22 日

Hackers or Hallucinators 論文閱讀分析:當自動滲透 Agent 看起來很會打,其實也可能只是很會掰

這篇論文真正有價值的地方,是把近年的 AutoPT 熱潮從 hype 拉回工程現實。作者在統一 benchmark 下比較 13 個 framework 後指出,真正拖垮自動滲透 agent 的,常常不是工具不夠多,也不是 agent role 不夠花,而是 memory 管理、knowledge alignment 與 hallucination control 沒做好。

2026 年 4 月 18 日