Blog

你的 AI 有「讨好型人格」——1460 次实验证实

10 个模型,1460 次控制实验。Anthropic 的模型讨好倾向最严重(OE 0.60),OpenAI 最克制(0.12)。三行规则就能治好它。