2026

AUTO-ART 論文閱讀分析:很多模型安全真正缺的,不是再多跑幾個 attack,而是先審評測是不是在騙你

這篇論文真正補的不是又一個 attack 套件,而是把 adversarial robustness evaluation 裡最常自欺的幾件事正面工程化:FOSC 抓 gradient masking、RDI 做 30× 快速 triage、multi-norm worst-case reporting 拆穿平均值幻覺。作者在 RobustBench top-10 models 上發現,worst-case multi-norm robustness 比單看 ℓ∞ 低 23.5 個百分點。

2026 年 4 月 23 日

AgentFlow 論文閱讀分析:很多漏洞 AI 真正缺的,不是更強模型,而是更會編隊的 harness

這篇論文真正補到的,不是再換一顆更強的漏洞模型,而是把 multi-agent harness 本身變成可搜尋、可診斷、可改寫的優化對象。作者提出 AgentFlow,以 typed graph DSL 同時搜尋角色、拓撲、prompt、tool binding 與 coordination protocol,在 TerminalBench-2 拿到 84.3%,並在 Google Chrome 上找到 10 個先前未知、且被廠商接受的 zero-days。

2026 年 4 月 23 日

FIDO2 論文閱讀分析:很多 passkey 真正厲害的,不是完全打不破,而是把攻擊者逼回更貴的世界

這篇論文真正有價值的,不是說 FIDO2 完全不能被打,而是把攻擊者還能怎麼打拆得很清楚:大多數成功路徑都得先控制受害者裝置、污染 trust store、做 DNS/ARP spoofing,或把使用者逼回較弱的 fallback 流程。也就是說,passkey 的真正優勢不是神奇免疫,而是把原本便宜、可規模化的 phishing 攻擊,推回更昂貴、更難複製的環境劫持模式。

2026 年 4 月 23 日

CyberCertBench 論文閱讀分析:很多模型真正危險的,不是完全不懂資安,而是只懂到足以讓你放下戒心

這篇論文真正量出的,不是模型會不會背資安常識,而是它在不同專業層次上的可靠度落差。CyberCertBench 用業界認證題目評估 LLM,結果顯示前沿模型在一般 IT security 題目上已接近人類專家,但一碰到 vendor-specific 細節、OT 場景與 ISA/IEC 62443 這類正式標準知識,表現就明顯掉階。

2026 年 4 月 23 日

AVISE 論文閱讀分析:很多 AI 安全真正缺的,不是再多一個攻擊 prompt,而是一套可重跑的評測框架

這篇論文真正補到的,不是又一組 jailbreak 技巧,而是把 attack、evaluation、aggregation 與 reporting 接成可重跑的 Security Evaluation Test。作者提出 AVISE 框架,並用 ALM 增強版 Red Queen 多輪攻擊示範:25 個 test cases、ELM 評估準確率 92%,且 9 個近期模型全都對這類多輪操控呈現不同程度脆弱性。

2026 年 4 月 23 日

LLMVD.js 論文閱讀分析:很多 Node.js 漏洞真正卡住的,不是找不到 sink,而是最後證不出它真能打

這篇論文真正補到的,不是又一個會喊這裡可能有洞的 AppSec agent,而是把 LLM 放進 exploit-oriented confirmation loop:先找候選、再寫 PoC、再跑 oracle,把 Node.js 漏洞發現從 pattern matching 往真正 exploitability 拉近。公開 benchmark 上確認率 83.75%,在 260 個新發布 npm packages 中最後人工驗證出 36 個有效漏洞。

2026 年 4 月 23 日

Synthetic Trajectory 隱私論文閱讀分析:很多 synthetic data 真正先外洩的,不是內容長得太像,而是 membership 早就被看穿

這篇論文真正有價值的地方,是把 synthetic trajectory 的常見幻覺拆開來看:很多研究一直在談 utility,卻沒有把 membership leakage 當成同等級風險正式驗證;作者不只整理 utility taxonomy,也證明某些看起來比較私密的模型仍可能在 membership inference 下高分失守。

2026 年 4 月 23 日

NeuroTrace 論文閱讀分析:很多 adversarial example 真正難抓的,不是哪層特徵太會藏,而是整次推理早就走歪了

這篇論文真正有價值的地方,不是又做出一個高分 adversarial detector,而是把檢測視角從局部 activation 訊號,往整次推理的 inference provenance 拉了一步。NeuroTrace 用 IPG 把 forward pass 變成可保存、可分析的執行證據,並在 cross-attack 與 cross-threat transfer 下展現很強的偵測力。

2026 年 4 月 23 日