Ukeate笔记

InstructGPT

相对GPT-3
- 引入人类反馈中强化学习RLHF(Reinforcement Learning from Human Feedback)
特点
- 遵循指令方面比GPT-3好得多
- 较少捏造事实
GPT-3.5
- 2021年四季度训练的InstructGPT模型
- 自动编写代码方面有较强的能力

关系图谱

反向链接

GPT

Created with Quartz v4.5.2 © 2026