Harmful Use

這篇論文真正補上的，不是 skill 裡有沒有 prompt injection，而是另一個更容易被低估的面向：如果 skill 本身的 intended functionality 就是 cyber attack、詐欺、隱私侵犯或高風險決策自動化，那 agent 其實是在被公開 skill 生態系統化地武裝。

2026 年 4 月 21 日

Harmful Use

2026

HarmfulSkillBench 論文閱讀分析：真正危險的 skill，未必會偷你的資料，它也可能只是把壞事包成一鍵可裝的能力

近期文章

廣告

文章分類

近期留言