GUI Agent TOCTOU 論文閱讀分析:真正危險的,不只是它看錯畫面,而是它出手時世界早就被偷偷換掉
這篇論文最值得記住的,不是 GUI agent 也會被打,而是 screenshot 到 click 之間那段幾秒鐘的 observation-to-action gap,本身就是可被利用的 control window。作者把它正式化成 Visual Atomicity Violation,並用接近 action dispatch 的 PUSV 三層檢查去補這個洞。
2026 年 4 月 22 日
