DynaHug 論文閱讀分析:真正危險的,不只是有毒資料或後門權重,而是你載模型那一下就可能把攻擊一起請進來
DynaHug 最重要的不是又做出一個惡意模型 classifier,而是把 Model Hub 風險重新拉回執行期:真正該問的不是模型檔看起來像不像壞東西,而是它載入時的行為像不像正常模型。
DynaHug 最重要的不是又做出一個惡意模型 classifier,而是把 Model Hub 風險重新拉回執行期:真正該問的不是模型檔看起來像不像壞東西,而是它載入時的行為像不像正常模型。
Refute-or-Promote 真正重要的,不是又多一條 AI 找洞工作流,而是把 LLM-assisted vulnerability discovery 從「會不會報」拉回「能不能先大規模殺掉假洞」,把漏洞 AI 的核心瓶頸重新定義成 precision crisis。
DeepRed 這篇真正重要的不是又多做一份 CTF 排名,而是把 autonomous offensive agent 的能力從 solved/unsolved 拉成可量的攻擊鏈進度,讓大家看見「部分自治」本身就是風險訊號。
Broken by Default 最重要的不是又做了一份模型排名,而是用 Z3 witness 把 AI 生成程式碼的漏洞從「看起來可疑」拉到「可被形式證明可利用」,直接打掉 secure-by-default 的錯覺。
EvoPatch-IoT 真正重要的,不是再做一個 binary similarity 分數,而是把 stripped BusyBox firmware 重新掛回漏洞 lineage,讓 analyst 能更快判斷這顆 binary 到底更像 vulnerable 還是 patched。
本文由 AI 產生、整理與撰寫。 論文基...
論文基本資訊 論文標題:Evaluati...
Cyber Defense Benchmark 這篇最重要的,不是又多一個 cyber benchmark,而是把 LLM agent 丟回真正像 SOC 的 open-ended threat hunting 任務:面對數萬到十幾萬筆 Windows logs,自己用 SQL 找出惡意事件時間點。結果五個 frontier models 全面失手,最佳模型平均也只找對 3.8% 惡意事件。
GAAP 這篇最重要的,不是再示範一次 prompt injection 很危險,而是把 agent privacy 問題重新定義成 runtime confidentiality:就算模型、prompt 與 provider 都不可信,只要資料流與 disclosure policy 還被 execution environment 硬鎖住,私密資料就不該被亂送出去。
這篇 SafeLM 最值得看的,不是它又把 trustworthy AI 變成一張更大的願望清單,而是它直接承認 federated LLM 的真實問題從來不是單點風險:你不只要防梯度與更新洩漏,還要一起管 hallucination、惡意輸入與聚合被帶偏。論文的價值,在於把 privacy、security、misinformation 與 adversarial robustness 拉回同一套系統設計來看。