语言模型趋向统计平均化 大型语言模型通过学习数以十亿计的文本样本来预测下一词或下一句,其核心机制是最大化生成序列的总体概率。这种基于概率的生成策略自然会偏向训练集中最常见的表达、过渡句式与结构模板,因此输出往往更贴近“统计平均”