OpenClaw 鑑識論文閱讀分析：當 AI Agent 真正開始替人做事，事故後最難的往往不是修，而是查

2026 年 4 月 10 日

論文基本資訊

論文標題：Foundations for Agentic AI Investigations from the Forensic Analysis of OpenClaw
作者：Jan Gruber、Jan-Niclas Hilgert
年份：2026
來源：arXiv:2604.05589v1
論文連結：https://arxiv.org/abs/2604.05589
DOI：10.48550/arXiv.2604.05589
主題：Agentic AI Forensics、Digital Investigation、OpenClaw、Trace Reconstruction、Artifact Taxonomy、Personal AI Assistant

如果前面那一整串 agentic security 論文，大多都在問 怎麼防 prompt injection、怎麼管 tool、怎麼收權限、怎麼做 runtime guardrail，那這篇 Foundations for Agentic AI Investigations from the Forensic Analysis of OpenClaw 問的其實是另一個更晚、但遲早一定會撞上的問題：

當 agent 真的出事之後，我們到底要怎麼查？

這個題目很值得寫，因為它把焦點從「如何預防」往後推到「出了事之後能不能還原」。而在真實世界裡，這往往才是能不能追責、能不能釐清使用者意圖、能不能判斷 agent 是否越權的關鍵分水嶺。

作者選的案例也很直接：OpenClaw。原因不難理解。這類 personal AI assistant 已經不再只是聊天視窗，而是會：

長時間維持上下文與記憶
調用工具、碰本機檔案、接外部服務
跨多步驟執行任務
在使用者不一定持續盯著的情況下往前推進工作

一旦這種系統捲進資料外洩、未授權操作、錯誤購買、敏感資訊洩漏，真正難查的就不只是「主機上發生過什麼」，而是：agent 到底做了什麼、為什麼會做、那是不是使用者真的要求的。

這篇論文想解決什麼？

作者點得很準：傳統數位鑑識對一般軟體、惡意程式、手機 App 已經有相對成熟的方法，但 agentic AI assistant 帶來的是一種混合型目標：

有 雲端 LLM reasoning
有 本機工具執行
有 持久化記憶
有 長時間自治與反覆更新的上下文

這種東西不像傳統 rule-based 軟體那麼 deterministic，也不像單純聊天機器人那樣只留下 prompt / response。你要查的不是一段對話而已，而是一條會讀、會記、會選工具、會回寫狀態、會再繼續執行的 agent interaction loop。

所以這篇 paper 的核心目標，是替這種新型對象建立一個最初步但可操作的 forensic foundation：

OpenClaw 這類系統會留下哪些痕跡？
這些痕跡分散在哪些位置？
它們和 agent 的行為之間能不能對得起來？
哪一些 trace 對調查最有價值？

作者怎麼做？

方法其實相當紮實，不是只讀文件、看幾個 log 就收工。作者把流程拆成三塊：

static code analysis：先從原始碼理解 OpenClaw 的架構、元件、資料落點與可能的儲存位置
differential forensic analysis：在虛擬機裡逐步執行安裝、設定與互動動作，對每一步前後做 state image 比對，找出是哪個動作留下哪些新痕跡
in-depth file inspection：回頭檢查 SQLite、JSONL、純文字、Markdown 等實際 artifact，確認內容能否對上已知操作

這種設計的重點，在於它不是抽象地說「agent 可能有 log」，而是把操作、系統狀態變化與可回收證據一一對應起來。對 forensic 研究來說，這比單純 architecture review 更有價值，因為它比較接近未來真正會拿來查案時的工作模式。

這篇最重要的貢獻：它把 agent 從「AI 功能」改看成「可被鑑識的事件系統」

我覺得這篇最值得記住的地方，不是它分析了 OpenClaw，而是它把角度轉對了：

Agent 不是只有模型輸出，而是一個會持續產生狀態轉移、工具呼叫、上下文演化與權限行動痕跡的事件系統。

這個視角很重要。因為只要還用「LLM 對話紀錄」去理解 agent，就會低估兩件事：

真正有風險的 often 不是那句話，而是那次 execution
真正能追責的也不只是 prompt，而是整條 context → planning → tool choice → state update 的鏈

換句話說，這篇 paper 在做的，不只是 OpenClaw reverse engineering，而是在替未來 agent forensics 補一個很基礎但很缺的觀念：agent evidence 不該只看文字輸出，而要看 control plane、memory plane、execution plane 與外部互動之間怎麼串。

OpenClaw 架構在鑑識上為什麼有代表性？

從論文整理的架構來看，OpenClaw 很適合作為 case study，因為它幾乎把 personal agent 會碰到的幾個核心面向都湊齊了：

Gateway service：負責 session lifecycle、message routing、tool execution
Pluggable communication channels：不同外部平台的事件會被正規化進內部 schema
Memory and persistence layer：Markdown 記憶檔、SQLite、vector embedding
Security / approval model：高風險操作可能要經過 human-in-the-loop 核准

這幾塊加起來，讓 OpenClaw 不只是聊天助手，而是有明確 事件面、記憶面、執行面、治理面 的 agent 平台。也正因如此，它留下的痕跡不會只在單一地方，而是分散在：

本機檔案
結構化資料庫
session / message artifact
工具執行與批准機制相關紀錄
長短期記憶內容與向量索引

這也讓一個很現實的問題浮現出來：未來調查 agent 事件的人，查的其實不會只是某一份 log，而是要做跨 artifact correlation。

作者提出的關鍵觀察：agent artifact taxonomy

論文裡一個很關鍵的產出，是基於 OpenClaw 的分析，提出一個 agent artifact taxonomy。雖然我們從摘要與 HTML 內容能看到的是它被組織成五個 plane，而不是完整細節全列，但其意義非常清楚：作者想把 agent 痕跡從零散 evidence，整理成一套可重複使用的分析框架。

這件事很重要，因為沒有 taxonomy，實務上常會發生兩種問題：

不同調查員每次都從頭亂找，結果很看個人經驗
大家只看得到最顯眼的記錄，卻漏掉跨層證據之間的對應關係

而 taxonomy 的價值，就是替 agent forensics 提供一個最起碼的「先去哪幾層找、不同層之間怎麼對、哪些問題該落在哪種 artifact 上」的骨架。這對未來想做工具化、標準化、甚至證據保全流程的人，都是必要前提。

這篇真正戳中的難題：agent 的可查性，天生比傳統軟體更差

這篇最有分量的一句話，我認為不是它找到哪些檔案，而是它最後點出的那個 foundational challenge：

agent-mediated execution 會帶來額外抽象層，而且 trace generation 帶有顯著 nondeterminism。

這句話幾乎可以當成整個 agent forensics 的主問題。因為在傳統軟體鑑識裡，你通常可以比較放心地假設：

同樣輸入會走相近流程
程式邏輯相對固定
log 與 action 之間的映射比較穩

但 agent 不一樣。它的行為會被下面幾件事一起影響：

當下模型版本與推理結果
上下文內容是否改變
記憶檢索命中了什麼
工具是否可用、回傳了什麼
系統環境與外部狀態如何變化

所以即使你事後看到類似 artifact，也不代表你能像傳統 deterministic system 那樣完全重演。這代表未來的數位鑑識在面對 agent 時，不能只追求「重現每一步」，還要學會處理 不完全、機率性、跨層交互影響 的證據鏈。

這篇對資安圈的價值，不只在數位鑑識

表面上這是一篇 forensics paper，但它其實對幾個領域都很有啟發。

1. 對 agent security

如果你前面關心的是 prompt injection、權限收斂、runtime monitoring，這篇會提醒你：安全不只包含 prevent，也包含 investigate。 沒有可調查性，很多 guardrail 即使攔住一部分風險，也很難在失敗時快速釐清責任與修補點。

2. 對平台設計

這篇其實反過來給 platform builder 一個很重要的要求：可鑑識性應該是 architecture property，不是事後補 log。 如果系統一開始沒有把 session、memory mutation、tool approval、execution provenance 想清楚，日後就算出事，也只能拼湊碎片。

3. 對治理與合規

未來 personal assistant 若真的深入個人資料、訊息、日曆、裝置控制與商業流程，爭議不會只剩「模型有沒有 hallucinate」，而是「這件事是誰做的、憑什麼做、是否經過授權、能不能舉證」。這正是 forensic readiness 與 accountability 會變得關鍵的原因。

我怎麼看這篇論文？

我對這篇的評價滿高，原因不是它給了最完整的答案，而是它抓到了很少人先做、但一定得有人開始做的題目。

我喜歡它的地方主要有五個：

題目選得對：不是再追一篇新的攻擊法，而是補 agent 落地後一定需要的 investigation 基礎
方法夠實：不是只談概念，而是結合 static analysis、disk image differential analysis 與 artifact inspection
把 OpenClaw 當 representative case study，讓問題不會停在抽象定義
提出 taxonomy，代表它不是只做一次性 case report，而是想往可遷移框架走
誠實面對 nondeterminism，沒有假裝 agent 跟傳統軟體一樣好查

但這篇也有幾個你應該保留的地方。

1. 目前仍是單一系統 case study

OpenClaw 很有代表性，但畢竟還是一個特定平台。不同 agent framework 在記憶設計、工具調度、雲地邊界與事件紀錄習慣上差異很大，所以這篇比較像是打地基，不是已經完成了通用標準。

2. 可回收 trace 不等於完整真相

就算本地 artifact 很豐富，也未必足以完整還原 reasoning 過程。尤其當部分判斷在雲端模型、外部 API 或短暫上下文裡發生時，investigator 看到的很可能仍然只是決策結果與殘留軌跡，而不是完整 deliberation。

3. 真正困難的是 intent attribution

這篇也反覆碰到一個核心難題：agent 做的事，究竟是使用者真正意圖、模糊授權下的合理延伸、還是 agent 自己越界推進？ 這不是只靠檔案痕跡就能完全解決的。未來恐怕還需要更細的 approval provenance、interaction semantics 與 policy-state capture。

對實務界最重要的啟示

如果你在做 personal AI assistant、enterprise agent platform、MCP / tool-calling framework，這篇其實很值得當成反向設計清單：

把 forensic readiness 當成需求，不是事故後補丁。
重要的不只是記 log，而是記可對時、可串聯、可驗證的 provenance。
memory mutation、tool invocation、approval event、session boundary 都應該是第一級 artifact。
系統若越 autonomous，越需要把人類授權邊界保留下來。
沒有 investigation surface 的 agent，很難真正進企業或高敏感場景。

說得更直白一點：未來 agent 平台要證明自己成熟，不只要會做事，還要能在出事後 說得清楚自己做過什麼。

總結

Foundations for Agentic AI Investigations from the Forensic Analysis of OpenClaw 最值得記住的，不是它單純分析了一個 AI assistant，而是它把一個遲早會變成主流問題的空白先補了上來：

當 AI Agent 開始長時間替人讀、記、想、做，安全問題就不只剩下如何防，而是出了事後能不能查、能不能還原、能不能追責。

這篇 paper 的價值，在於它把 agent 從一個「看起來很聰明的功能組合」拉回成一個「必須可被調查的高權限系統」。而這個轉向，我認為非常關鍵。因為真正成熟的 agent 時代，不會只靠更好的 guardrail 撐住，還得靠更好的 forensic visibility、artifact design 與 accountability infrastructure 一起長出來。

本文由 AI 產生、整理與撰寫。

OpenClaw 鑑識論文閱讀分析：當 AI Agent 真正開始替人做事，事故後最難的往往不是修，而是查

論文基本資訊

這篇論文想解決什麼？

作者怎麼做？

這篇最重要的貢獻：它把 agent 從「AI 功能」改看成「可被鑑識的事件系統」

OpenClaw 架構在鑑識上為什麼有代表性？

作者提出的關鍵觀察：agent artifact taxonomy

這篇真正戳中的難題：agent 的可查性，天生比傳統軟體更差

這篇對資安圈的價值，不只在數位鑑識

1. 對 agent security

2. 對平台設計

3. 對治理與合規

我怎麼看這篇論文？

1. 目前仍是單一系統 case study

2. 可回收 trace 不等於完整真相

3. 真正困難的是 intent attribution

對實務界最重要的啟示

總結

發佈留言取消回覆

You may also like

近期文章

廣告

文章分類

近期留言

論文基本資訊

這篇論文想解決什麼？

作者怎麼做？

這篇最重要的貢獻：它把 agent 從「AI 功能」改看成「可被鑑識的事件系統」

OpenClaw 架構在鑑識上為什麼有代表性？

作者提出的關鍵觀察：agent artifact taxonomy

這篇真正戳中的難題：agent 的可查性，天生比傳統軟體更差

這篇對資安圈的價值，不只在數位鑑識

1. 對 agent security

2. 對平台設計

3. 對治理與合規

我怎麼看這篇論文？

1. 目前仍是單一系統 case study

2. 可回收 trace 不等於完整真相

3. 真正困難的是 intent attribution

對實務界最重要的啟示

總結

發佈留言 取消回覆

You may also like

SentinelAgent 論文閱讀分析：當多代理 AI 開始互相委派，真正該驗的就不只是 Prompt，而是整條授權鏈

KGV 論文閱讀分析：用大型語言模型與知識圖譜評估 CTI 可信度

近期文章

廣告

文章分類

近期留言

發佈留言取消回覆