Tool Poisoning

2026

TRUSTDESC 論文閱讀分析:真正該防的不是工具描述裡哪句話有毒,而是模型為什麼還在直接相信它

TRUSTDESC 不再停在檢測惡意 tool description,而是從工具實作中自動生成較可信的 description,並以靜態切片、語義去毒與動態驗證把 tool poisoning 的信任問題往前推回 description integrity。真正的重點是:在 agent 時代,模型看到的工具語義不該再直接由第三方自我宣告。

2026 年 4 月 10 日