介绍GPT-3的三种训练方式:代码训练、指令微调和RLHF,以及各自得到的模型,包括初代Codex、instructionGPT、code-davinci-002和text-davinci-002、ChatGPT等。同时讨论了这些模型在不同任务上的表现优劣,以及text-davinci-003和ChatGPT通过牺牲上下文学习能力获得更好的零样本学习能力和对话历史建模能力的优势。