这个方法算 SFT（监督微调，还得照这个标准批改 3 篇实例）；更重要的是基础工作：预训练（pretraining，高质量文本，海量阅读，占99% 的训练计算量）；更好的后训练方式…

@mranti@x.good.news

@mranti@x.good.news

0/480