近期文章
- Synthetic Trajectory 隱私論文閱讀分析:很多 synthetic data 真正先外洩的,不是內容長得太像,而是 membership 早就被看穿
- SafeDream 論文閱讀分析:很多多輪 jailbreak 真正危險的,不是某句突然失守,而是整段對話正在把模型慢慢推向 compliance
- NeuroTrace 論文閱讀分析:很多 adversarial example 真正難抓的,不是哪層特徵太會藏,而是整次推理早就走歪了
- Agent 善後論文閱讀分析:很多 computer-use agent 真正缺的,不是別出事,而是出事後能不能把局面收回來
- ContextLeak 論文閱讀分析:很多 private ICL 真正缺的,不是防禦更多,而是先量出它到底漏多少
