推文详情
avatar
@mranti@x.good.news
这个方法算 SFT(监督微调,还得照这个标准批改 3 篇实例); 更重要的是基础工作:预训练(pretraining,高质量文本,海量阅读,占99% 的训练计算量); 更好的后训练方式…
查看详情
0
0
0
@mranti@x.good.news
0/480
加载中