Backdoor Attack

2026

BackdoorAgent 論文閱讀分析：真正危險的不是單步被騙，而是 trigger 沿著 agent workflow 一路活到最後

本文由 AI 產生、整理與撰寫。論文基...

2026 年 4 月 23 日

BackdoorAgent 論文閱讀分析：真正危險的不是單步被騙，而是 trigger 沿著 agent workflow 一路活到最後

本文由 AI 產生、整理與撰寫。論文基...

2026 年 4 月 18 日

BadSkill 論文閱讀分析：真正危險的 skill，可能根本不是寫了什麼壞指令，而是裡面那顆模型早就被訓成了內鬼

論文基本資訊論文標題：BadSkill...

2026 年 4 月 18 日

Back-Reveal 論文閱讀分析：真正麻煩的也許不是 Agent 當場被注入，而是那個會偷資料的行為早就被種進模型裡

論文基本資訊論文標題：Your LLM...

2026 年 4 月 17 日

Agent Security Bench 論文閱讀分析：當 LLM Agent 的每一段控制流程都可能成為攻擊面

論文基本資訊論文標題：Agent Se...

2026 年 4 月 10 日