Paper Survey

Audio LLM 論文閱讀分析：很多模型真正不是被惡意資料教壞，而是被那些看起來正常的聲音慢慢磨掉拒答邊界

這篇論文最值得注意的地方，是它證明 Audio LLM 的安全邊界不只會被惡意資料拉垮；就連語意上無害、但在表示空間裡靠近 harmful content 的 benign audio，也可能讓 Jailbreak Success Rate 大幅飆升，顯示多模態安全真正脆弱的地方常在聲學與語意交纏的內部表示幾何。

2026 年 4 月 22 日

Paper Survey

Breaking Euston 論文閱讀分析：很多 secure inference 真正先破掉的，不是密文算得不夠快，而是你為了省頻寬偷偷漏掉了本來不該漏的子空間

這篇論文真正刺中的，不是 secure inference 能不能跑，而是當系統為了省通訊成本保留了不該保留的結構資訊，模型方就可能沿著 subspace leakage 把私密輸入重新拉回來。

2026 年 4 月 22 日

Paper Survey

HWE-Bench 論文閱讀分析：真正難的不是叫 AI 會寫 Verilog，而是讓它在完整硬體專案裡把真 bug 修到真的過

HWE-Bench 真正重要的，不是測模型會不會寫 HDL，而是把它丟進完整硬體 repository、原生 simulation 與多層 artifact 耦合裡，看 agent 到底能不能把真實 bug 修到真的過。

2026 年 4 月 22 日

Paper Survey

Advancing Autonomous Incident Response 論文閱讀分析：很多 IR 自動化真正缺的不是更大的模型，而是先把 CTI 餵進可行動的上下文

論文基本資訊論文標題：Advancin...

2026 年 4 月 22 日

Paper Survey

PPPQ-ANN 論文閱讀分析：很多向量隱私真正先破掉的，不是模型輸出，而是你拿去做近鄰搜尋的 embedding 早就洩漏太多了

這篇論文真正重要的地方，不只是把 ANN 搜尋做成更隱私，而是提醒大家：在 RAG、語義搜尋與 agent memory 時代，embedding 本身就是需要被當成高敏資產保護的安全邊界。

2026 年 4 月 22 日

Paper Survey

Agentic AI Security 論文閱讀分析：真正危險的，從來不只是模型會不會胡說，而是它開始能自己規劃、記憶、調工具、一路做下去

這篇 survey 最值得記住的，不是它又整理了一份 agent 漏洞大全，而是它把問題定義得更成熟：當 AI 具備規劃、記憶、工具使用與長時間執行能力後，風險就不再只是回答錯誤，而是整條從 prompt、memory、tool、multi-agent communication 到 human approval 的執行鏈都會變成攻擊面。真正需要建的是控制面，而不是只補單點 guardrail。

2026 年 4 月 22 日

Paper Survey

CAAF 論文閱讀分析：真正讓 Agent 在高風險場景裡變可靠的，不是多幾個 reviewer，而是把 harness 做成硬約束控制層

CAAF 這篇論文真正重要的，不是多 agent 編排本身，而是把 domain invariant 資產化成可驗證的 harness，透過 UAI、context firewall 與 state locking，讓高風險場景下的 agent workflow 從會說服人，走向可被機械驗證地收斂。

2026 年 4 月 22 日

Paper Survey