Mastiporuto Senia

Cyber Defense Benchmark 這篇最重要的，不是又多一個 cyber benchmark，而是把 LLM agent 丟回真正像 SOC 的 open-ended threat hunting 任務：面對數萬到十幾萬筆 Windows logs，自己用 SQL 找出惡意事件時間點。結果五個 frontier models 全面失手，最佳模型平均也只找對 3.8% 惡意事件。

2026 年 4 月 22 日

Paper Survey

GAAP 論文閱讀分析：真正該保的不是模型會不會被騙，而是就算它被騙了也別把你的私密資料送出去

GAAP 這篇最重要的，不是再示範一次 prompt injection 很危險，而是把 agent privacy 問題重新定義成 runtime confidentiality：就算模型、prompt 與 provider 都不可信，只要資料流與 disclosure policy 還被 execution environment 硬鎖住，私密資料就不該被亂送出去。

2026 年 4 月 22 日

Paper Survey

SafeLM 論文閱讀分析：真正讓 federated LLM 比較可信的，不是把資料分散出去而已，而是別讓隱私、對齊與亂講各自掉線

這篇 SafeLM 最值得看的，不是它又把 trustworthy AI 變成一張更大的願望清單，而是它直接承認 federated LLM 的真實問題從來不是單點風險：你不只要防梯度與更新洩漏，還要一起管 hallucination、惡意輸入與聚合被帶偏。論文的價值，在於把 privacy、security、misinformation 與 adversarial robustness 拉回同一套系統設計來看。

2026 年 4 月 22 日

Paper Survey

Audio LLM 論文閱讀分析：很多模型真正不是被惡意資料教壞，而是被那些看起來正常的聲音慢慢磨掉拒答邊界

這篇論文最值得注意的地方，是它證明 Audio LLM 的安全邊界不只會被惡意資料拉垮；就連語意上無害、但在表示空間裡靠近 harmful content 的 benign audio，也可能讓 Jailbreak Success Rate 大幅飆升，顯示多模態安全真正脆弱的地方常在聲學與語意交纏的內部表示幾何。

2026 年 4 月 22 日

Paper Survey

Breaking Euston 論文閱讀分析：很多 secure inference 真正先破掉的，不是密文算得不夠快，而是你為了省頻寬偷偷漏掉了本來不該漏的子空間

這篇論文真正刺中的，不是 secure inference 能不能跑，而是當系統為了省通訊成本保留了不該保留的結構資訊，模型方就可能沿著 subspace leakage 把私密輸入重新拉回來。

2026 年 4 月 22 日

2026

CTF Agent 論文閱讀分析：真正該量的不是 AI 有沒有一把梭拿到 root，而是它沿著攻擊鏈到底推進了多遠

Broken by Default 論文閱讀分析：很多 AI coding 真正危險的，不是它偶爾寫壞，而是它常把能跑和可被打爆一起交給你

EvoPatch-IoT 論文閱讀分析：很多 IoT 韌體真正卡住的，不是 CVE 不夠多，而是你根本不知道眼前這顆 BusyBox 到底修了沒

多步驟 Cyber Attack 評測論文閱讀分析：真正該注意的，不是 AI 會不會單點解題，而是它已經開始能把整條攻擊鏈慢慢接起來

Cyber Defense Benchmark 論文閱讀分析：很多 SOC AI 真正還不會的，不是回答安全問題，而是自己把惡意事件從海量 log 裡找出來

GAAP 論文閱讀分析：真正該保的不是模型會不會被騙，而是就算它被騙了也別把你的私密資料送出去

SafeLM 論文閱讀分析：真正讓 federated LLM 比較可信的，不是把資料分散出去而已，而是別讓隱私、對齊與亂講各自掉線

Audio LLM 論文閱讀分析：很多模型真正不是被惡意資料教壞，而是被那些看起來正常的聲音慢慢磨掉拒答邊界

Breaking Euston 論文閱讀分析：很多 secure inference 真正先破掉的，不是密文算得不夠快，而是你為了省頻寬偷偷漏掉了本來不該漏的子空間

近期文章

廣告

文章分類

近期留言