Paper Survey

2026

Audio LLM 論文閱讀分析:很多模型真正不是被惡意資料教壞,而是被那些看起來正常的聲音慢慢磨掉拒答邊界

這篇論文最值得注意的地方,是它證明 Audio LLM 的安全邊界不只會被惡意資料拉垮;就連語意上無害、但在表示空間裡靠近 harmful content 的 benign audio,也可能讓 Jailbreak Success Rate 大幅飆升,顯示多模態安全真正脆弱的地方常在聲學與語意交纏的內部表示幾何。

2026 年 4 月 22 日

Agentic AI Security 論文閱讀分析:真正危險的,從來不只是模型會不會胡說,而是它開始能自己規劃、記憶、調工具、一路做下去

這篇 survey 最值得記住的,不是它又整理了一份 agent 漏洞大全,而是它把問題定義得更成熟:當 AI 具備規劃、記憶、工具使用與長時間執行能力後,風險就不再只是回答錯誤,而是整條從 prompt、memory、tool、multi-agent communication 到 human approval 的執行鏈都會變成攻擊面。真正需要建的是控制面,而不是只補單點 guardrail。

2026 年 4 月 22 日