HarmfulSkillBench 論文閱讀分析:真正危險的 skill,未必會偷你的資料,它也可能只是把壞事包成一鍵可裝的能力
這篇論文真正補上的,不是 skill 裡有沒有 prompt injection,而是另一個更容易被低估的面向:如果 skill 本身的 intended functionality 就是 cyber attack、詐欺、隱私侵犯或高風險決策自動化,那 agent 其實是在被公開 skill 生態系統化地武裝。
2026 年 4 月 21 日
這篇論文真正補上的,不是 skill 裡有沒有 prompt injection,而是另一個更容易被低估的面向:如果 skill 本身的 intended functionality 就是 cyber attack、詐欺、隱私侵犯或高風險決策自動化,那 agent 其實是在被公開 skill 生態系統化地武裝。