Data Extraction Attacks

2026

CTIGuardian 論文閱讀分析:很多 CTI 模型真正先外洩的,不是被打穿,而是你親手拿私有資料把它教太熟

這篇論文真正有價值的地方,是把一個很多團隊會忽略的風險講白:當你用私有 CTI 資料把模型 fine-tune 得更懂安全,也可能順手把它教成更會洩密的系統;作者提出的 CTIGuardian,則嘗試用 few-shot 的 privacy alignment 在不重訓整顆模型的前提下補這條洞。

2026 年 4 月 23 日