Atomic Decision Boundaries 論文閱讀分析:真正能保證 Agent 不在最後一刻越界的,不是事前多看一次,而是判斷和出手根本沒有縫
這篇論文真正關鍵的,不是再講一次 policy 要多嚴,而是指出只要 decision 和 state transition 仍然分兩步,execution-time admissibility 就可能在最後一刻蒸發。
2026 年 4 月 22 日
這篇論文真正關鍵的,不是再講一次 policy 要多嚴,而是指出只要 decision 和 state transition 仍然分兩步,execution-time admissibility 就可能在最後一刻蒸發。
這篇論文最值得記住的,不是 GUI agent 也會被打,而是 screenshot 到 click 之間那段幾秒鐘的 observation-to-action gap,本身就是可被利用的 control window。作者把它正式化成 Visual Atomicity Violation,並用接近 action dispatch 的 PUSV 三層檢查去補這個洞。