PCFI 論文閱讀分析:真正該防的,往往不是哪段外部文字看起來像攻擊,而是它有沒有開始越權改寫 prompt 控制流
這篇論文真正值得看的,不是又多一個 prompt injection detector,而是它把 prompt security 重新表述成控制面完整性問題:低優先序內容一旦開始越權改寫 system / developer 層級的指令,問題就不再是壞字串,而是 control-flow 已經被劫持。
2026 年 4 月 21 日
這篇論文真正值得看的,不是又多一個 prompt injection detector,而是它把 prompt security 重新表述成控制面完整性問題:低優先序內容一旦開始越權改寫 system / developer 層級的指令,問題就不再是壞字串,而是 control-flow 已經被劫持。