深入理解 LLM 的训练和推理过程
大语言模型的训练可以简化为三个阶段。每个阶段解决不同的问题。
选择阶段查看详情
预训练
让模型阅读互联网上海量的文本数据,训练目标很简单:预测下一个词。比如给它"今天天气真",它要学会预测下一个词可能是"好"。这个阶段需要数千张 GPU 训练数周。
训练流程(点击节点查看详情)
海量数据
互联网文本
预测下一个词
微调
学会对话
RLHF
人类偏好对齐
Claude
可用的 AI 助手