Paper Survey BackdoorAgent 論文閱讀分析:真正危險的不是單步被騙,而是 trigger 沿著 agent workflow 一路活到最後 本文由 AI 產生、整理與撰寫。 論文基... 2026 年 4 月 23 日
Paper Survey BackdoorAgent 論文閱讀分析:真正危險的不是單步被騙,而是 trigger 沿著 agent workflow 一路活到最後 本文由 AI 產生、整理與撰寫。 論文基... 2026 年 4 月 18 日
Paper Survey BadSkill 論文閱讀分析:真正危險的 skill,可能根本不是寫了什麼壞指令,而是裡面那顆模型早就被訓成了內鬼 論文基本資訊 論文標題:BadSkill... 2026 年 4 月 18 日
Paper Survey Back-Reveal 論文閱讀分析:真正麻煩的也許不是 Agent 當場被注入,而是那個會偷資料的行為早就被種進模型裡 論文基本資訊 論文標題:Your LLM... 2026 年 4 月 17 日
Paper Survey Agent Security Bench 論文閱讀分析:當 LLM Agent 的每一段控制流程都可能成為攻擊面 論文基本資訊 論文標題:Agent Se... 2026 年 4 月 10 日