LLM Privacy

LLM 隱私稽核論文閱讀分析：很多防護真正缺的，不是再多一條規則，而是先量模型到底記住了多少

這篇論文真正值得看的，不是它再說一次 differential privacy 很重要，而是它把 LLM 隱私稽核拉回成可量測的工程流程：用 membership inference attack 當隱私 gauge、用 perplexity 當 utility gauge，持續調整 DP-SGD 直到兩邊都過線。更有意思的是，在狹窄且容易過擬合的微調情境下，DP 不只降低隱私風險，還可能順手壓住記憶化，讓模型的分布外效能反而更穩。

2026 年 4 月 29 日

Paper Survey

ContextLeak 論文閱讀分析：很多 private ICL 真正缺的，不是防禦更多，而是先量出它到底漏多少

這篇論文真正有價值的地方，不是再發明一個新的 private ICL 防禦，而是補上大家一直缺的 audit layer：用 canary insertion 和 targeted queries 去量 worst-case leakage。ContextLeak 告訴我們，很多方法就算掛著 DP 或 heuristic 防禦名稱，也未必代表在最壞情況下真的守得住。

2026 年 4 月 23 日

Paper Survey

PPFT 論文閱讀分析：很多 LLM 隱私真正先失守的，不是回答，而是 prompt 一開始就裸奔上雲

這篇論文真正有價值的地方，不只是再做一個 prompt 遮罩技巧，而是把「不要把原始 prompt 明文送上 server」做成同時支撐 inference 與 fine-tuning 的 text-free pipeline。PPFT 以 client-side encoder、k-pooling、Laplace noise 與 server-side alignment/adaptation，在 prompt privacy 和模型 utility 之間給出一個比既有基線更可部署的折衷。

2026 年 4 月 23 日

Paper Survey

CTIGuardian 論文閱讀分析：很多 CTI 模型真正先外洩的，不是被打穿，而是你親手拿私有資料把它教太熟

這篇論文真正有價值的地方，是把一個很多團隊會忽略的風險講白：當你用私有 CTI 資料把模型 fine-tune 得更懂安全，也可能順手把它教成更會洩密的系統；作者提出的 CTIGuardian，則嘗試用 few-shot 的 privacy alignment 在不重訓整顆模型的前提下補這條洞。

2026 年 4 月 23 日

2026

LLM 隱私稽核論文閱讀分析：很多防護真正缺的，不是再多一條規則，而是先量模型到底記住了多少

ContextLeak 論文閱讀分析：很多 private ICL 真正缺的，不是防禦更多，而是先量出它到底漏多少

PPFT 論文閱讀分析：很多 LLM 隱私真正先失守的，不是回答，而是 prompt 一開始就裸奔上雲

CTIGuardian 論文閱讀分析：很多 CTI 模型真正先外洩的，不是被打穿，而是你親手拿私有資料把它教太熟

近期文章

廣告

文章分類

近期留言