近期文章
- Agentic AI Systems 分層安全論文閱讀分析:很多 agent 真正缺的,不是 attack 名詞,而是知道哪一層在出血
- Intention Deception 論文閱讀分析:很多 frontier model 真正危險的,不是會拒絕失手,而是太努力當個好人
- RVC 論文閱讀分析:很多 RowHammer mitigation 真正缺的,不是再多記幾次 activation,而是先知道誰真的快翻了
- TIGS 論文閱讀分析:很多 backdoored LLM 真正缺的,不是再多一層說教,而是 trigger 一接管注意力就有人當場關門
- Containment 論文閱讀分析:很多 agent 真正危險的,不是它會亂來,而是管它的人還住在它隔壁
