Paper Survey

Paper Survey

ARCANE 論文閱讀分析：很多威脅歸因真正缺的，不是再多一筆 telemetry，而是先承認敵人本來就長得很像

本文由 AI 產生、整理與撰寫。論文基...

2026 年 4 月 28 日

Paper Survey

AgentWard 論文閱讀分析：真正會害死 autonomous agent 的，通常不是單一 prompt，而是整條 lifecycle 一路把風險送到執行端

本文由 AI 產生、整理與撰寫。論文基...

2026 年 4 月 28 日

Paper Survey

SOC 導入 LLM 論文閱讀分析：很多團隊真正缺的不是更強模型，而是別再拿分析師當導入實驗品

這篇論文不是再吹 autonomous SOC，而是研究為什麼很多分析師一開始根本不信任 LLM，以及要如何透過嵌入式田野、共創與持續迭代，把 AI 工具磨成真的有人願意持續使用的 companion tool。

2026 年 4 月 28 日

Paper Survey

AUTO-ART 論文閱讀分析：很多模型安全真正缺的，不是再多跑幾個 attack，而是先審評測是不是在騙你

這篇論文真正補的不是又一個 attack 套件，而是把 adversarial robustness evaluation 裡最常自欺的幾件事正面工程化：FOSC 抓 gradient masking、RDI 做 30× 快速 triage、multi-norm worst-case reporting 拆穿平均值幻覺。作者在 RobustBench top-10 models 上發現，worst-case multi-norm robustness 比單看 ℓ∞ 低 23.5 個百分點。

2026 年 4 月 23 日

Paper Survey

AgentSOC 論文閱讀分析：很多 SOC AI 真正卡住的，不是看不懂告警，而是不敢替你做下一步判斷

這篇論文真正想補的，不是再做一個會摘要 SOC 告警的 copilot，而是把 perception、anticipatory reasoning 與 risk-based action planning 串成同一條 operational loop，讓安全營運從看懂事件進一步走到比較敢用、也比較不容易亂出手的回應建議。

2026 年 4 月 23 日

Paper Survey

AgentFlow 論文閱讀分析：很多漏洞 AI 真正缺的，不是更強模型，而是更會編隊的 harness

這篇論文真正補到的，不是再換一顆更強的漏洞模型，而是把 multi-agent harness 本身變成可搜尋、可診斷、可改寫的優化對象。作者提出 AgentFlow，以 typed graph DSL 同時搜尋角色、拓撲、prompt、tool binding 與 coordination protocol，在 TerminalBench-2 拿到 84.3%，並在 Google Chrome 上找到 10 個先前未知、且被廠商接受的 zero-days。

2026 年 4 月 23 日

Paper Survey

FIDO2 論文閱讀分析：很多 passkey 真正厲害的，不是完全打不破，而是把攻擊者逼回更貴的世界

這篇論文真正有價值的，不是說 FIDO2 完全不能被打，而是把攻擊者還能怎麼打拆得很清楚：大多數成功路徑都得先控制受害者裝置、污染 trust store、做 DNS/ARP spoofing，或把使用者逼回較弱的 fallback 流程。也就是說，passkey 的真正優勢不是神奇免疫，而是把原本便宜、可規模化的 phishing 攻擊，推回更昂貴、更難複製的環境劫持模式。

2026 年 4 月 23 日

Paper Survey

CyberCertBench 論文閱讀分析：很多模型真正危險的，不是完全不懂資安，而是只懂到足以讓你放下戒心

這篇論文真正量出的，不是模型會不會背資安常識，而是它在不同專業層次上的可靠度落差。CyberCertBench 用業界認證題目評估 LLM，結果顯示前沿模型在一般 IT security 題目上已接近人類專家，但一碰到 vendor-specific 細節、OT 場景與 ISA/IEC 62443 這類正式標準知識，表現就明顯掉階。

2026 年 4 月 23 日

Paper Survey

AVISE 論文閱讀分析：很多 AI 安全真正缺的，不是再多一個攻擊 prompt，而是一套可重跑的評測框架

這篇論文真正補到的，不是又一組 jailbreak 技巧，而是把 attack、evaluation、aggregation 與 reporting 接成可重跑的 Security Evaluation Test。作者提出 AVISE 框架，並用 ALM 增強版 Red Queen 多輪攻擊示範：25 個 test cases、ELM 評估準確率 92%，且 9 個近期模型全都對這類多輪操控呈現不同程度脆弱性。

2026 年 4 月 23 日

Paper Survey

LLMVD.js 論文閱讀分析：很多 Node.js 漏洞真正卡住的，不是找不到 sink，而是最後證不出它真能打

這篇論文真正補到的，不是又一個會喊這裡可能有洞的 AppSec agent，而是把 LLM 放進 exploit-oriented confirmation loop：先找候選、再寫 PoC、再跑 oracle，把 Node.js 漏洞發現從 pattern matching 往真正 exploitability 拉近。公開 benchmark 上確認率 83.75%，在 260 個新發布 npm packages 中最後人工驗證出 36 個有效漏洞。

2026 年 4 月 23 日

2026

ARCANE 論文閱讀分析：很多威脅歸因真正缺的，不是再多一筆 telemetry，而是先承認敵人本來就長得很像

AgentWard 論文閱讀分析：真正會害死 autonomous agent 的，通常不是單一 prompt，而是整條 lifecycle 一路把風險送到執行端

SOC 導入 LLM 論文閱讀分析：很多團隊真正缺的不是更強模型，而是別再拿分析師當導入實驗品

AUTO-ART 論文閱讀分析：很多模型安全真正缺的，不是再多跑幾個 attack，而是先審評測是不是在騙你

AgentSOC 論文閱讀分析：很多 SOC AI 真正卡住的，不是看不懂告警，而是不敢替你做下一步判斷

AgentFlow 論文閱讀分析：很多漏洞 AI 真正缺的，不是更強模型，而是更會編隊的 harness

FIDO2 論文閱讀分析：很多 passkey 真正厲害的，不是完全打不破，而是把攻擊者逼回更貴的世界

CyberCertBench 論文閱讀分析：很多模型真正危險的，不是完全不懂資安，而是只懂到足以讓你放下戒心

AVISE 論文閱讀分析：很多 AI 安全真正缺的，不是再多一個攻擊 prompt，而是一套可重跑的評測框架

LLMVD.js 論文閱讀分析：很多 Node.js 漏洞真正卡住的，不是找不到 sink，而是最後證不出它真能打

近期文章

廣告

文章分類

近期留言