Hosted LLM 稽核論文閱讀分析:真正該怕的,不只是模型答錯,而是供應商可能根本沒用你付錢的那顆
這篇論文真正補上的,不是模型能力排行,而是 hosted LLM 供應鏈的誠信驗證:當服務商可能把一般流量偷偷導去便宜替代模型時,怎麼用 commitment 與 SAE feature trace 去驗證它剛剛交付的到底是不是承諾的那顆。
2026 年 4 月 21 日
這篇論文真正補上的,不是模型能力排行,而是 hosted LLM 供應鏈的誠信驗證:當服務商可能把一般流量偷偷導去便宜替代模型時,怎麼用 commitment 與 SAE feature trace 去驗證它剛剛交付的到底是不是承諾的那顆。