Data Extraction Attacks

這篇論文真正有價值的地方，是把一個很多團隊會忽略的風險講白：當你用私有 CTI 資料把模型 fine-tune 得更懂安全，也可能順手把它教成更會洩密的系統；作者提出的 CTIGuardian，則嘗試用 few-shot 的 privacy alignment 在不重訓整顆模型的前提下補這條洞。

2026 年 4 月 23 日

CTIGuardian 論文閱讀分析：很多 CTI 模型真正先外洩的，不是被打穿，而是你親手拿私有資料把它教太熟