Differential Privacy

2026

X-NegoBox 論文閱讀分析:很多高敏資料共享真正缺的,不是固定一個 epsilon,而是讓隱私預算真的能談

這篇論文最值得看的,不是又把 differential privacy 套進一個新領域,而是把資料共享真正麻煩的部分拉回桌上:同一份高敏資料,不同請求方、不同用途、不同歷史行為,根本不該吃同一個固定 privacy budget。X-NegoBox 把隱私預算改寫成可協商、可解釋、可在本地 sandbox 執行的 runtime decision process,核心不是「給不給」,而是「怎麼在不先交出生資料的前提下談出最小揭露的可接受方案」。

2026 年 4 月 29 日

LLM 隱私稽核論文閱讀分析:很多防護真正缺的,不是再多一條規則,而是先量模型到底記住了多少

這篇論文真正值得看的,不是它再說一次 differential privacy 很重要,而是它把 LLM 隱私稽核拉回成可量測的工程流程:用 membership inference attack 當隱私 gauge、用 perplexity 當 utility gauge,持續調整 DP-SGD 直到兩邊都過線。更有意思的是,在狹窄且容易過擬合的微調情境下,DP 不只降低隱私風險,還可能順手壓住記憶化,讓模型的分布外效能反而更穩。

2026 年 4 月 29 日

PROMPT Framework 論文閱讀分析:很多宣傳偵測系統真正先失守的,不是模型抓不到,而是為了抓到先把人看得太清楚

這篇論文真正重要的,不是再做一份 propaganda detection survey,而是把內容安全系統的隱私帳攤開來算:很多系統不是先輸在抓不到,而是為了抓到先收了過多 metadata、關聯與使用者層級訊號。PROMPT 把風險、緩解、合規與效能取捨放回同一張工程圖上。

2026 年 4 月 23 日

LLM API 資料外洩風險論文閱讀分析:別再拿 DP 與 membership inference 當成訓練資料抽取風險的萬用護身符

這篇論文最值得記住的,不是它又提出一種 memorization 指標,而是它把一件很多人搞混的事拆開講清楚:differential privacy 與 membership inference 量的是 distinguishability,不是 LLM API 被抽出訓練文本的真實成本。作者提出 (l, b)-inextractability,把風險轉成攻擊者平均需要多少次查詢才能誘發受保護片段,並指出固定 greedy、固定 top-k 的舊量測方式很容易低估最壞情況。

2026 年 4 月 22 日