Semantic DoS 論文閱讀分析:很多 LLM robot 真正先被打掉的,不是 integrity,而是被安全語言嚇到停工
這篇論文指出,很多 LLM 控制的機器人真正先被打掉的不是 integrity,而是 availability:攻擊者只要往音訊管道塞進幾句看似合理的安全警語,就能觸發模型的 safety reasoning,讓系統停工、誤報或卡進等待迴圈。
2026 年 4 月 29 日
這篇論文指出,很多 LLM 控制的機器人真正先被打掉的不是 integrity,而是 availability:攻擊者只要往音訊管道塞進幾句看似合理的安全警語,就能觸發模型的 safety reasoning,讓系統停工、誤報或卡進等待迴圈。