OpenAI 联合创始人、研究科学家 John Schulman 认为，RLHF 才是 ChatGPT 的秘密武器（secret sauce）。训练数据的体量固然重要，但是让 ChatGPT 更容易推断出用户的意图，产生质变的根本原因是已在 InstructGPT（ChatGPT 前身）使用的 “人类反馈的强化学习（RLHF）” 技术。Google…

发布时间: 2023-12-10 13:01:31

2分

数据加载中

OpenAI 联合创始人、研究科学家 John Schulman 认为，RLHF 才是 ChatGPT 的秘密武器（secret sauce）。训练数据的体量固然重要，但是让 ChatGPT 更容易推断出用户的意图，产生质变的根本原因是已在 InstructGPT（ChatGPT 前身）使用的 “人类反馈的强化学习（RLHF）” 技术。
Google…
IT技术
( twitter.com )

OpenAI 联合创始人、研究科学家 John Schulman 认为，RLHF 才是 ChatGPT 的秘密武器（secret sauce）。训练数据的体量固然重要，但是让 ChatGPT 更容易推断出用户的意图，产生质变的根本原因是已在 InstructGPT（ChatGPT 前身）使用的 “人类反馈的强化学习（RLHF）” 技术。

Google 最近写了一篇论文《RLAIF: Scaling Reinforcement Learning from Human Feedback with AI Feedback》，https://t.co/vOIe86f6BP，提出了使用 AI Feedback (RLAIF) 来进行强化学习，根据人类评估者的评价，在摘要、有帮助的对话生成和无害对话生成等任务中，RLAIF 取得了与 RLHF 相当或更好的性能。

结合 OpenAI Q*（Q-Star）项目的爆料，“AI 具备了自主学习和自我改进的能力，模型可进行自主决策，并且可能已具备轻微自我意识”，有研究者猜测与强化学习中的 Q-learning 算法相关。这个方向的最新资料值得跟踪学习下。

奖励模型是强化学习中的重要组成部分，OpenAI 训练中涉及到这一块的公开内容是比较少的，《The History and Risks of Reinforcement Learning and Human Feedback》，https://t.co/Em9UJI2k0J，这篇论文强调了奖励模型缺乏透明度和严格评估，并呼吁在该领域进行更全面的研究和透明度。

奖励模型的设计直接影响了 AI 与用户进行正常交流时所表现出的道德判断、价值观念和偏见，如果 AI 具备了轻微的自我意识，那么这部分内容的公开透明在未来也会变得更加重要。

点击图片查看原图

Markdown支持

评论加载中...

您可能感兴趣的：更多

【“新基石研究员”首期资助名单公布，58位研究员入围】“新基石研究员项目”是一项聚焦原始创新、鼓励自由探索、公益属性的新型基础研究资助项目。腾讯公司将在10年内投入100亿元人民币，长期稳定地支持一批杰出科学家潜心基础研究、实现“从0到1”的原始创新。
大陆资讯
( new.qq.com)

1年前 • rabbit • -- 点击 0 评论

闪电预览

自动Agent已经推出了2个半月。

OpenAI联创提到现在是研究自动Agent的最好契机：当新的Agents论文出来的时候，我们都非常感兴趣

6月27日，OpenAI应用研究主管…
IT技术
( twitter.com)

10个月前 • Will 3.6-6.16 硅谷 • -- 点击 0 评论

研究ChatGPT的人很多，研究创始人山姆的就很少了，研究山姆还在YC期间OpenAI的主要负责人Greg Brockman就更少了。
我研究了Greg三年发的上千条推文，发现了以下有趣的事情和线索，希望能对你有所启发。
IT技术
( twitter.com)

11个月前 • 自在夺造化 • -- 点击 0 评论

《自然-神经科学》研究：科学家发现人类如何感知寒冷
大陆资讯
( www.ithome.com)

1个月前 • 妮妮娃 • -- 点击 0 评论

闪电预览

【新疆社科院副研究员杜曼被软禁5年后下落不明】
【文学界十多哈萨克族人被捕】
新疆社科院语言研究所副研究员 #杜曼·加合甫，被软禁5年后，一个月前与家人失去联系。海外 #哈萨克族人权组织称，学者杜曼失联应与其个人学术观点有关。另外，近期，新疆文学界十多哈萨克族人被捕。…
时政
( twitter.com)

4个月前 • 自由亚洲电台 • -- 点击 0 评论

OpenAI联合创始人兼前董事长Greg Brockman刚刚晒出一张OpenAI员工们的合照，并配文“我们终于回来了。”随后，OpenAI官方账号也转发了这张照片，并配文“没有员工的OpenAI就什么也不是。”
大陆资讯

5个月前 • 你妹的溢达 • -- 点击 0 评论

IT技术

OpenAI以泄密为由解雇两名研究人员，包括首席科学家盟友
大陆资讯
( www.163.com)

大陆资讯

“研究生联名举报导师”背后，“研究生都搞不定”的中小学科创比赛引热议
大陆资讯
( www.thecover.cn)

大陆资讯

德国之声调查研究发现，德国柏林马克斯·伯恩研究所与朝鲜之间的学术合作有可能违反了联合国制裁禁令。这一事件开始令人们关注德国如何处理科研自由的边界问题。

时政
( www.dw.com)

时政

大陆资讯

自动Agent已经推出了2个半月。

OpenAI联创提到现在是研究自动Agent的最好契机：当新的Agents论文出来的时候，我们都非常感兴趣

6月27日，OpenAI应用研究主管…
IT技术
( twitter.com)

IT技术

研究ChatGPT的人很多，研究创始人山姆的就很少了，研究山姆还在YC期间OpenAI的主要负责人Greg Brockman就更少了。
我研究了Greg三年发的上千条推文，发现了以下有趣的事情和线索，希望能对你有所启发。
IT技术
( twitter.com)

IT技术

《自然-神经科学》研究：科学家发现人类如何感知寒冷
大陆资讯
( www.ithome.com)

大陆资讯

时政

OpenAI联合创始人兼前董事长Greg Brockman刚刚晒出一张OpenAI员工们的合照，并配文“我们终于回来了。”随后，OpenAI官方账号也转发了这张照片，并配文“没有员工的OpenAI就什么也不是。”
大陆资讯

大陆资讯

IT技术

OpenAI以泄密为由解雇两名研究人员，包括首席科学家盟友 大陆资讯 ( www.163.com)

大陆资讯

“研究生联名举报导师”背后，“研究生都搞不定”的中小学科创比赛引热议 大陆资讯 ( www.thecover.cn)

大陆资讯

德国之声调查研究发现，德国柏林马克斯·伯恩研究所与朝鲜之间的学术合作有可能违反了联合国制裁禁令。这一事件开始令人们关注德国如何处理科研自由的边界问题。 时政 ( www.dw.com)

时政

大陆资讯

自动Agent已经推出了2个半月。 OpenAI联创 提到现在是研究自动Agent的最好契机：当新的Agents论文出来的时候，我们都非常感兴趣 6月27日，OpenAI应用研究主管… IT技术 ( twitter.com)

IT技术

研究ChatGPT的人很多，研究创始人山姆的就很少了，研究山姆还在YC期间OpenAI的主要负责人Greg Brockman就更少了。 我研究了Greg三年发的上千条推文，发现了以下有趣的事情和线索，希望能对你有所启发。 IT技术 ( twitter.com)

IT技术

《自然-神经科学》研究：科学家发现人类如何感知寒冷 大陆资讯 ( www.ithome.com)

大陆资讯

时政

OpenAI联合创始人兼前董事长Greg Brockman刚刚晒出一张OpenAI员工们的合照，并配文“我们终于回来了。”随后，OpenAI官方账号也转发了这张照片，并配文“没有员工的OpenAI就什么也不是。” 大陆资讯

大陆资讯

创建一个新帐户

登录

OpenAI以泄密为由解雇两名研究人员，包括首席科学家盟友
大陆资讯
( www.163.com)

“研究生联名举报导师”背后，“研究生都搞不定”的中小学科创比赛引热议
大陆资讯
( www.thecover.cn)

德国之声调查研究发现，德国柏林马克斯·伯恩研究所与朝鲜之间的学术合作有可能违反了联合国制裁禁令。这一事件开始令人们关注德国如何处理科研自由的边界问题。

时政
( www.dw.com)

自动Agent已经推出了2个半月。

OpenAI联创提到现在是研究自动Agent的最好契机：当新的Agents论文出来的时候，我们都非常感兴趣

6月27日，OpenAI应用研究主管…
IT技术
( twitter.com)

研究ChatGPT的人很多，研究创始人山姆的就很少了，研究山姆还在YC期间OpenAI的主要负责人Greg Brockman就更少了。
我研究了Greg三年发的上千条推文，发现了以下有趣的事情和线索，希望能对你有所启发。
IT技术
( twitter.com)

《自然-神经科学》研究：科学家发现人类如何感知寒冷
大陆资讯
( www.ithome.com)

OpenAI联合创始人兼前董事长Greg Brockman刚刚晒出一张OpenAI员工们的合照，并配文“我们终于回来了。”随后，OpenAI官方账号也转发了这张照片，并配文“没有员工的OpenAI就什么也不是。”
大陆资讯