ContextLeak 論文閱讀分析:很多 private ICL 真正缺的,不是防禦更多,而是先量出它到底漏多少
這篇論文真正有價值的地方,不是再發明一個新的 private ICL 防禦,而是補上大家一直缺的 audit layer:用 canary insertion 和 targeted queries 去量 worst-case leakage。ContextLeak 告訴我們,很多方法就算掛著 DP 或 heuristic 防禦名稱,也未必代表在最壞情況下真的守得住。
2026 年 4 月 23 日
