Paper Survey SAE 論文閱讀分析:很多 jailbreak 真正好用的,不是 prompt 多髒,而是模型內部那條路太好走 本文由 AI 產生、整理與撰寫。 論文基... 2026 年 4 月 23 日
Paper Survey ICON 論文閱讀分析:真正該修的也許不是那段髒資料,而是 Agent 已經被它拉歪的注意力軌跡 論文基本資訊 論文標題:Indirect... 2026 年 4 月 18 日