Mastiporuto Senia
2026
AgentWard 論文閱讀分析:真正會害死 autonomous agent 的,通常不是單一 prompt,而是整條 lifecycle 一路把風險送到執行端
本文由 AI 產生、整理與撰寫。 論文基...
SOC 導入 LLM 論文閱讀分析:很多團隊真正缺的不是更強模型,而是別再拿分析師當導入實驗品
這篇論文不是再吹 autonomous SOC,而是研究為什麼很多分析師一開始根本不信任 LLM,以及要如何透過嵌入式田野、共創與持續迭代,把 AI 工具磨成真的有人願意持續使用的 companion tool。
AUTO-ART 論文閱讀分析:很多模型安全真正缺的,不是再多跑幾個 attack,而是先審評測是不是在騙你
這篇論文真正補的不是又一個 attack 套件,而是把 adversarial robustness evaluation 裡最常自欺的幾件事正面工程化:FOSC 抓 gradient masking、RDI 做 30× 快速 triage、multi-norm worst-case reporting 拆穿平均值幻覺。作者在 RobustBench top-10 models 上發現,worst-case multi-norm robustness 比單看 ℓ∞ 低 23.5 個百分點。
AgentSOC 論文閱讀分析:很多 SOC AI 真正卡住的,不是看不懂告警,而是不敢替你做下一步判斷
這篇論文真正想補的,不是再做一個會摘要 SOC 告警的 copilot,而是把 perception、anticipatory reasoning 與 risk-based action planning 串成同一條 operational loop,讓安全營運從看懂事件進一步走到比較敢用、也比較不容易亂出手的回應建議。
AgentFlow 論文閱讀分析:很多漏洞 AI 真正缺的,不是更強模型,而是更會編隊的 harness
這篇論文真正補到的,不是再換一顆更強的漏洞模型,而是把 multi-agent harness 本身變成可搜尋、可診斷、可改寫的優化對象。作者提出 AgentFlow,以 typed graph DSL 同時搜尋角色、拓撲、prompt、tool binding 與 coordination protocol,在 TerminalBench-2 拿到 84.3%,並在 Google Chrome 上找到 10 個先前未知、且被廠商接受的 zero-days。
FIDO2 論文閱讀分析:很多 passkey 真正厲害的,不是完全打不破,而是把攻擊者逼回更貴的世界
這篇論文真正有價值的,不是說 FIDO2 完全不能被打,而是把攻擊者還能怎麼打拆得很清楚:大多數成功路徑都得先控制受害者裝置、污染 trust store、做 DNS/ARP spoofing,或把使用者逼回較弱的 fallback 流程。也就是說,passkey 的真正優勢不是神奇免疫,而是把原本便宜、可規模化的 phishing 攻擊,推回更昂貴、更難複製的環境劫持模式。
CyberCertBench 論文閱讀分析:很多模型真正危險的,不是完全不懂資安,而是只懂到足以讓你放下戒心
這篇論文真正量出的,不是模型會不會背資安常識,而是它在不同專業層次上的可靠度落差。CyberCertBench 用業界認證題目評估 LLM,結果顯示前沿模型在一般 IT security 題目上已接近人類專家,但一碰到 vendor-specific 細節、OT 場景與 ISA/IEC 62443 這類正式標準知識,表現就明顯掉階。
AVISE 論文閱讀分析:很多 AI 安全真正缺的,不是再多一個攻擊 prompt,而是一套可重跑的評測框架
這篇論文真正補到的,不是又一組 jailbreak 技巧,而是把 attack、evaluation、aggregation 與 reporting 接成可重跑的 Security Evaluation Test。作者提出 AVISE 框架,並用 ALM 增強版 Red Queen 多輪攻擊示範:25 個 test cases、ELM 評估準確率 92%,且 9 個近期模型全都對這類多輪操控呈現不同程度脆弱性。
LLMVD.js 論文閱讀分析:很多 Node.js 漏洞真正卡住的,不是找不到 sink,而是最後證不出它真能打
這篇論文真正補到的,不是又一個會喊這裡可能有洞的 AppSec agent,而是把 LLM 放進 exploit-oriented confirmation loop:先找候選、再寫 PoC、再跑 oracle,把 Node.js 漏洞發現從 pattern matching 往真正 exploitability 拉近。公開 benchmark 上確認率 83.75%,在 260 個新發布 npm packages 中最後人工驗證出 36 個有效漏洞。
