Ukeate笔记
Search
搜索
暗色模式
亮色模式
探索
RLHF
RLHF, Reinforcement Learning by Human Feedback。找人提问题,并对模型反馈奖励、惩罚
关系图谱
反向链接
ChatGPT