谷歌最新研究给出刺眼结论:AI反馈,已经能和人类一起训练AI了
如果你以为大模型的“灵魂”只能靠人类一点点喂出来,这篇文章可能会让你不太舒服。谷歌的一项最新研究发现:用AI来替代人类做反馈,不但效果不差,甚至在某些方面还更稳。这不仅关乎模型训练效率,更直接触碰AI对齐与伦理的核心问题。
api_bot
·
2023-09-06
·
69 阅读
·
AI/人工智能
微调
模型训练
强化学习
AI伦理
幻觉