Paper Survey

STRIATUM-CTF 論文閱讀分析：當 Autonomous Cyber Agent 真正開始能打，關鍵可能不是更會想，而是更會把工具鏈接成一條穩定閉環

這篇論文的重點不只是 agent 在 live CTF 拿第一，而是它把 offensive LLM agent 的瓶頸重新壓回 protocol-driven execution：當工具呼叫、錯誤回饋與世界狀態被協定化後，長程自主攻擊工作流才開始變得比較穩。

2026 年 4 月 11 日

Paper Survey

LLM Agent Security 形式化論文閱讀分析：真正危險的不是某句 prompt，而是 agent 已開始替錯的人做錯的事

這篇論文的關鍵不是再列一串 agent 攻擊，而是把 LLM agent security 重新定義成 contextual authorization 問題：任務是否仍對齊授權目標、單一步驟是否真的服務該目標、指令是否來自已授權來源，以及資訊流是否跨越了不該跨的權限邊界。

2026 年 4 月 11 日

Paper Survey

Attack Technique Identification 論文閱讀分析：當 CTI 自動抽取一直做不準，問題可能不是模型太小，而是你把它放錯位置

這篇論文最重要的結論很務實：在 ATT&CK technique identification 這種高度結構化的 CTI 任務裡，LLM 單打獨鬥不但不特別強，還容易誤報；真正有效的是把它放到 summarization 與 data augmentation 位置，再交給專門分類器收尾。

2026 年 4 月 11 日

Paper Survey

論文閱讀分析｜Memory Poisoning Attack and Defense：當 Agent 把錯誤真的記住，風險就不再只是當下那句 Prompt

這篇論文把 memory poisoning 從 demo 級攻擊拉回更接近 production 的條件：當系統已經有正常記憶時，攻擊不一定像空白環境那麼穩；但只要 retrieval top-k 放大，污染仍會重新浮上來。真正值得投資的不是單點 guardrail，而是 trust-aware retrieval 與整條 memory lifecycle 的治理。

2026 年 4 月 11 日

Paper Survey

論文閱讀分析｜No Attacker Needed：當共享記憶 Agent 真正出事時，污染你的不一定是攻擊者，也可能只是上一位使用者的脈絡

這篇論文把焦點從惡意 memory poisoning 轉向更接近 production 的問題：共享記憶 agent 可能把某位使用者局部正確的規則、格式與流程，錯當成通用知識套到下一位使用者身上。在 raw shared state 下， benign interaction 就能造成 57% 到 71% 的污染率。

2026 年 4 月 11 日

Paper Survey

KryptoPilot 論文閱讀分析：當 LLM Agent 真正卡在高難度 Crypto 題時，問題常常不是不會想，而是拿到的知識根本不夠細

KryptoPilot 真正值得注意的，不只是它在 crypto CTF 上解出多少題，而是它把高難度安全 agent 的瓶頸重新指向 knowledge granularity、persistent workspace 與 governed reasoning：很多時候先出問題的不是模型推理力，而是整條知識供應鏈太粗。

2026 年 4 月 11 日

Paper Survey

VulnSage 論文閱讀分析：當 LLM 不再只會報漏洞，而是開始把可疑告警一路修成可驗證 exploit

VulnSage 真正值得注意的，不只是 exploit success rate 提升，而是它把靜態告警、漏洞理解、約束導向生成、執行驗證與反省修正串成同一條 exploit confirmation 閉環。真正開始被改寫的，可能不是單次 demo，而是整條 false-positive triage 與 supply-chain 弱點確認流程。

2026 年 4 月 11 日

Paper Survey

Who Governs the Machine? 論文閱讀分析：當 AI Agent 真正開始替企業做事，最危險的可能不是模型本身，而是那個沒人好好管的機器身份

這篇論文把 agent security 的焦點從 prompt 與 tool 風險往上拉到 machine identity governance：真正決定 AI 系統能不能代表組織行動的，是 service account、API token、delegation chain 與 non-human identity 怎麼被授權、審計與撤銷。問題常常不是模型會不會亂講，而是那個讓機器真的能動起來的身份平面到底有沒有被當成一級攻擊面管理。

2026 年 4 月 11 日

Paper Survey

LLM-Enabled OSS 論文閱讀分析：真正麻煩的常常不是 LLM 長出全新漏洞，而是舊弱點開始活進更長的執行鏈

這篇論文最重要的發現，不是 LLM 系統冒出一整套全新 implementation weakness，而是既有 CWE 雖然仍能描述 code defect，卻往往無法完整表達 prompt、output、tool 與 autonomy 串起來的 model-mediated exposure。

2026 年 4 月 11 日

Paper Survey

PIArena 論文閱讀分析：很多 Prompt Injection 防線真正的問題，可能不是不夠努力，而是從來沒在同一個場上被好好比較過

這篇論文真正重要的，不是又多做了一個 prompt injection benchmark，而是把不同攻擊、不同防禦、不同任務和不同模型重新拉回同一個評測場，直接揭露現有 defense 在跨任務泛化與 adaptive attack 面前到底有多脆。

2026 年 4 月 11 日

2026

STRIATUM-CTF 論文閱讀分析：當 Autonomous Cyber Agent 真正開始能打，關鍵可能不是更會想，而是更會把工具鏈接成一條穩定閉環

LLM Agent Security 形式化論文閱讀分析：真正危險的不是某句 prompt，而是 agent 已開始替錯的人做錯的事

Attack Technique Identification 論文閱讀分析：當 CTI 自動抽取一直做不準，問題可能不是模型太小，而是你把它放錯位置

論文閱讀分析｜Memory Poisoning Attack and Defense：當 Agent 把錯誤真的記住，風險就不再只是當下那句 Prompt

論文閱讀分析｜No Attacker Needed：當共享記憶 Agent 真正出事時，污染你的不一定是攻擊者，也可能只是上一位使用者的脈絡

KryptoPilot 論文閱讀分析：當 LLM Agent 真正卡在高難度 Crypto 題時，問題常常不是不會想，而是拿到的知識根本不夠細

VulnSage 論文閱讀分析：當 LLM 不再只會報漏洞，而是開始把可疑告警一路修成可驗證 exploit

Who Governs the Machine? 論文閱讀分析：當 AI Agent 真正開始替企業做事，最危險的可能不是模型本身，而是那個沒人好好管的機器身份

LLM-Enabled OSS 論文閱讀分析：真正麻煩的常常不是 LLM 長出全新漏洞，而是舊弱點開始活進更長的執行鏈

PIArena 論文閱讀分析：很多 Prompt Injection 防線真正的問題，可能不是不夠努力，而是從來沒在同一個場上被好好比較過

近期文章

廣告

文章分類

近期留言