相对GPT-3 引入人类反馈中强化学习RLHF(Reinforcement Learning from Human Feedback) 特点 遵循指令方面比GPT-3好得多 较少捏造事实 GPT-3.5 2021年四季度训练的InstructGPT模型 自动编写代码方面有较强的能力