AI Runtime Infrastructure 論文閱讀分析：當 Agent 真正會失控時，問題往往不是模型不夠強，而是執行中根本沒人接手

2026 年 4 月 18 日

AI Runtime Infrastructure 論文閱讀分析：當 Agent 真正會失控時，問題往往不是模型不夠強，而是執行中根本沒人接手

本文由 AI 產生、整理與撰寫。

如果最近 sectools.tw 這條線，已經一路從 prompt injection、tool poisoning、memory poisoning、privilege separation、durable write 與 runtime governance 慢慢往上拼，那這篇 AI Runtime Infrastructure 很值得補，因為它處理的是一個更底層、也更接近 production 現場的問題：當 agent 真正跑進長鏈任務後，最常害死它的其實不是「不會想」，而是 execution 已經開始歪了，系統卻還沒有一個專門在執行期盯著它、拉回它、救回它的基礎設施層。

這篇論文不是在做新的 benchmark，也不是在發明更強的 base model；它真正想 formalize 的，是一個介於 model serving 和 application logic 之間、但以前常被當成雜項 glue code 的層：AI runtime infrastructure。作者的核心主張很乾脆——對長時程 agent 來說，很多最貴、最危險、也最常發生的失敗，其實都不是 build-time 問題，而是 runtime problem。

論文標題：AI Runtime Infrastructure
來源：arXiv:2603.00495v2（2026）
研究類型：agent systems architecture / runtime infrastructure position paper
核心關鍵字：agent runtime、execution-time intervention、long-horizon state、failure recovery、policy enforcement

這篇論文在處理什麼核心問題？

作者認為，現在大家談 agent infrastructure 時，通常會先想到三層：

model serving / inference infra：處理 batching、caching、latency、hardware scheduling
agent orchestration：處理 prompts、tools、workflow、control flow
observability / AgentOps：處理 logs、traces、metrics、事後 debug

這三層都重要，但它們剛好在一個最痛的地方留下空洞：agent 已經開始執行之後，如果 context 爆了、推理漂了、tool call 一路把錯誤放大、或安全風險在中途才浮出來，到底誰來即時介入？

這篇 paper 的答案是：需要把這件事獨立成一層。作者把它叫做 AI Runtime Infrastructure，也就是一個運行在模型之上、應用之下，能在執行過程中持續觀測 agent 狀態、判斷是否偏航、並在必要時主動出手的 execution-time control layer。

作者的主張很值得記住：很多 agent failure 根本不是 prompt 設計問題，而是執行期治理問題

這篇最有價值的地方，是它把一堆平常會被分散理解的問題，重新收斂成同一條 runtime 主線。作者指出，長鏈 agent 常見失敗包括：

context window 溢出，早期關鍵資訊被擠掉
中間推理慢慢偏離原始 task objective
tool interactions 把局部錯誤一路往下游放大
latency、token cost、memory 壓力在多步任務中失控
安全風險不是一開始就可見，而是在中段才出現

換句話說，很多 production 級 agent 真正出事的瞬間，不是在第一個 prompt，而是在第 17 步、42 步、或某次工具回傳之後。 這正是為什麼只靠靜態 orchestration 或事後 observability 不夠：前者通常寫死流程，後者通常只會在事後告訴你「剛剛怎麼死的」，但都不擅長在 agent 還沒完全掉坑前就把它拉回來。

作者怎麼定義 AI Runtime Infrastructure？

論文給了一個很清楚的定義：AI Runtime Infrastructure 是一層在 execution time 持續觀察、推理並干預 agent 行為的系統層。它的目標不是替代模型，也不是承接應用邏輯，而是在 agent 執行期間，同時對 task success、latency、token efficiency、reliability 與 safety 做控制。

作者還進一步提出，能不能算 runtime infrastructure，至少要滿足三個必要條件：

during execution：不是事前規則，也不是事後分析，而是 agent 在跑時就持續看到狀態
active intervention：不只監控，要能真的修改 execution behavior
long-horizon reasoning：不是只看當前 prompt，而是會納入多步歷史與累積狀態

這三點其實很重要，因為它把 runtime infrastructure 和一堆相鄰概念切開了。不是所有會記 log 的東西都叫 runtime，也不是所有能跑 workflow 的框架都真的在做 runtime control。

它跟現有東西差在哪？這篇 paper 最大貢獻之一就是切邊界

作者花了不少篇幅去區分它和幾類常被混在一起的系統：

不是 inference optimization：caching、batching、hardware scheduling 只優化單次 model call，不處理 agent 長鏈行為
不是 orchestration framework：workflow 框架決定 agent 應該怎麼走，但通常不會在執行中持續修正 agent 已經走歪的路
不是 observability / AgentOps：trace 與 metrics 幫你 debug 很重要，但本質上偏 retrospective
不是 post-hoc safety filter：輸出後再擋，通常已經太晚，尤其對會調工具、會操作環境的 agent 更是如此

這個 framing 很對。因為對真正會碰外部系統、長時間執行、還得續跑的 agent 來說，execution itself is the battleground。很多失敗不是模型不夠好，而是少了一層專門在 execution path 上做觀測、壓縮、回復與執法的系統。

這篇論文提出哪些設計原則？

論文在設計原則上整理得很實用，至少有六條值得直接記：

1. Execution-time intervention

不能只看，還要能動。runtime layer 必須能在 agent 還在跑時修改 contextual input、調整 control flow、觸發 recovery，否則只是高級監視器，不是 runtime infrastructure。

2. Long-horizon state awareness

長鏈 agent 的問題常常是累積效應，所以 runtime layer 必須記得過去做過什麼、哪些 tool 已經失敗過、哪些上下文其實已經過期、哪些風險訊號正在反覆出現。

3. Closed-loop control

這層不是單向監控，而是 observation → diagnosis → intervention → re-observation 的閉環。這也讓它更像控制系統，而不只是 logging pipeline。

4. Model-agnostic

作者主張 runtime 層不該綁死在某個模型內部，而是盡量獨立於特定 provider / architecture。這點很實務，因為 production 環境會換模型、會多模型並行，runtime 若不抽象化，很快就會變成脆弱的客製 patch。

5. Application-agnostic

runtime infrastructure 應提供一般化的 execution control，而不是把業務邏輯硬寫進去。否則它就不再是 infra，而只是某個產品的內嵌 rule engine。

6. Safety、cost、reliability 都是 runtime concern

這篇很好的地方是沒有把安全獨立神化。作者認為 safety、效率、穩定性本來就會在 runtime 一起發生 trade-off，因此應該一起被 runtime layer 處理，而不是拆成互不往來的後補模組。

這篇 paper 最值得 sectools.tw 讀者吸收的點：它把 agent security 從「內容安全」往「執行治理」再推了一層

如果把這篇放回最近一連串 agentic security 論文脈絡裡，它的價值不是提出新的攻擊，而是替很多已經看過的問題補上一個系統層答案。

像 prompt injection、tool poisoning、memory poisoning、privilege misuse、durable write failure 這些題目，表面上各自不同，但其實都在問同一件事：當 agent 執行鏈已經開始展開，誰有能力在中途看出風險、攔住偏航、保住上下文、並讓系統可恢復？

這篇給出的方向非常明確：

把 context 視為高風險控制面，而不是單純資料
把 recovery 當成 runtime 第一級能力，而不是例外狀況
把長鏈 state 管理視為基礎設施，而不是 prompt engineering 附屬品
把安全、成本、可靠性都拉回 execution-time decision making

這種 framing 很適合 production-minded 的安全觀點。因為真正落地後，agent 最常見的死法很少是單一 catastrophic bug，而更常是一路小錯累積、上下文腐化、工具互動放大、最後整條 workflow 慢慢爛掉。

論文也有侷限：它更像 architectural manifesto，而不是完整驗證論文

這篇不是 benchmark paper，也不是帶大量量化結果的系統實驗論文。它更像是一篇很有方向感的 position / architecture paper：先把系統層定義出來，再用兩個早期實例（文中提到的 AFM 與 VIGIL）說明這層為什麼值得獨立存在。

所以如果你期待它回答「runtime infrastructure 到底比某個現有框架好多少」或「不同 intervention policy 的量化 trade-off 是什麼」，這篇還不會一次給完整答案。但這不一定是缺點，因為它真正重要的貢獻，是先把這個層命名、切邊界、定責任。很多時候，系統成熟的第一步不是 benchmark，而是大家先同意：對，這確實是一個值得單獨設計的層。

我的看法

AI Runtime Infrastructure 這篇最值得收進最近主線的地方，在於它把 agent 系統真正常出事的那一段，從「工程細節」提升成「架構層問題」。很多人還在用 model quality、prompt quality、tool quality 去理解 agent 成敗，但這篇提醒得很準：對長鏈 agent 來說，真正決定能不能上 production 的，往往是執行中那個看不見、但必須一直在線的 runtime control plane。

如果之後 agent 要真的走進 SOC、自動化開發、reverse engineering、cloud forensics 或各種高權限工作流，那 runtime infrastructure 多半不會只是加分項，而會是必要條件。因為安全世界很少給你「一路照計畫成功」的乾淨環境；真正值錢的系統，不是永遠不出錯，而是出錯時能被看見、能被攔住、能被修正、能繼續跑。

而這篇 paper 的核心訊息，其實就一句話：Agent 的戰場不只在 prompt，也不只在 model，而是在 execution。

AI Runtime Infrastructure 論文閱讀分析：當 Agent 真正會失控時，問題往往不是模型不夠強，而是執行中根本沒人接手

AI Runtime Infrastructure 論文閱讀分析：當 Agent 真正會失控時，問題往往不是模型不夠強，而是執行中根本沒人接手

這篇論文在處理什麼核心問題？

作者的主張很值得記住：很多 agent failure 根本不是 prompt 設計問題，而是執行期治理問題

作者怎麼定義 AI Runtime Infrastructure？

它跟現有東西差在哪？這篇 paper 最大貢獻之一就是切邊界

這篇論文提出哪些設計原則？

1. Execution-time intervention

2. Long-horizon state awareness

3. Closed-loop control

4. Model-agnostic

5. Application-agnostic

6. Safety、cost、reliability 都是 runtime concern

這篇 paper 最值得 sectools.tw 讀者吸收的點：它把 agent security 從「內容安全」往「執行治理」再推了一層

論文也有侷限：它更像 architectural manifesto，而不是完整驗證論文

我的看法

發佈留言取消回覆

You may also like

近期文章

廣告

文章分類

近期留言

AI Runtime Infrastructure 論文閱讀分析：當 Agent 真正會失控時，問題往往不是模型不夠強，而是執行中根本沒人接手

這篇論文在處理什麼核心問題？

作者的主張很值得記住：很多 agent failure 根本不是 prompt 設計問題，而是執行期治理問題

作者怎麼定義 AI Runtime Infrastructure？

它跟現有東西差在哪？這篇 paper 最大貢獻之一就是切邊界

這篇論文提出哪些設計原則？

1. Execution-time intervention

2. Long-horizon state awareness

3. Closed-loop control

4. Model-agnostic

5. Application-agnostic

6. Safety、cost、reliability 都是 runtime concern

這篇 paper 最值得 sectools.tw 讀者吸收的點：它把 agent security 從「內容安全」往「執行治理」再推了一層

論文也有侷限：它更像 architectural manifesto，而不是完整驗證論文

我的看法

發佈留言 取消回覆

You may also like

Advancing Autonomous Incident Response 論文閱讀分析：很多 IR 自動化真正缺的不是更大的模型，而是先把 CTI 餵進可行動的上下文

長期記憶安全論文閱讀分析：很多 Agent 真正最危險的，不是當下被騙，而是被騙過的東西還會一直留在腦子裡

近期文章

廣告

文章分類

近期留言

發佈留言取消回覆