OpenAI 创始人 John Schulman 访谈节选：为什么 GPT-4 比一年前更“聪明”了？主要都是后训练（Post-Training）带来的！

发布时间: 2024-05-17 11:10:30

1分

数据加载中

OpenAI 创始人 John Schulman 访谈节选：为什么 GPT-4 比一年前更“聪明”了？主要都是后训练（Post-Training）带来的！
IT技术
( twitter.com )

OpenAI 创始人 John Schulman 访谈节选：为什么 GPT-4 比一年前更“聪明”了？主要都是后训练（Post-Training）带来的！

另外他认为，在强化学习研究领域，研究人员需要具备丰富的经验和敏锐的直觉。了解整个技术堆栈，并对各个部分充满好奇心是关键。此外，从第一性原理出发思考问题，而不仅仅依靠实验证据，也能够帮助研究人员在数据操控和环境设置方面做出更好的决策。

***

Dwarkesh Patel：在未来，用于训练的计算力中，预训练与后训练的比例是否会明显偏向后训练呢？

John Schulman：确实，有一些观点支持这种说法。

Dwarkesh Patel：我是说，现在这个比例非常不平衡。

John Schulman：但你可以认为，模型生成的输出质量比网上的大多数内容都要高。因此，让模型自己思考似乎更有道理，而不仅仅是训练来模仿网络上的内容。所以，我认为从第一性原理上来说，这是有说服力的。我会说，我们通过后训练取得了很多进步。因此，我不确定。所以，我希望我们会继续推动这种方法，并且可能会增加投入到后训练中的计算力。

Dwarkesh Patel：当前的 GPT-4 的 ELO 分数比最初发布的版本高出了大约 100 分。这是否全都是后训练带来的改进呢？

John Schulman：对，我会说大部分都是后训练带来的。

Dwarkesh Patel：这很有意思。

John Schulman：因此，有很多不同的改进方向。我们会考虑数据质量，数据数量，进行更多的部署和收集新数据的迭代，改变你收集的注解种类。因此，有很多因素叠加在一起。但是全部加在一起，就会带来一个相当不错的，有效的计算力提升。

Dwarkesh Patel：后训练的优化程度对于竞争优势有多大影响呢？

John Schulman：目前，我会区别公司是通过我们的模型有多大等等。那么，找出你之前提到的所有这些数据的复杂问题的公司，会占据大优势吗？

John Schulman：我认为这确实是一个优势，因为这是一个非常复杂的任务。因此，你必须有很多有技能的人来执行它。因此，存在大量的隐性知识。同时也需要大量的组织知识。我认为后训练的过程，创建一个具备人们所关心的所有功能的模型，是十分复杂的。这需要付出大量的努力，它是大量研发工作的积累。我会说这种情况在某种程度上形成了一种壁垒，要想立即启动这种模型并非易事。

Dwarkesh Patel：看起来那些正在进行最严肃的预训练努力的公司，也在进行严肃的后训练努力。因此，看起来这种模型有可能被复制或有更多的类似努力出现。

John Schulman：另外，还有一种情况使得这个壁垒并非那么明显，那就是你可以提取模型，或者复制别人的模型输出，或者使用别人的模型进行比较。我认为大公司可能并不会这样做，因为这违反了服务条款，也会损害他们的自尊心，但我预计一些规模较小的参与者可能正在这样做以便更好地起步。

Dwarkesh Patel：那些真正擅长进行这种强化学习（RL）研究的人有什么样的特质呢？我听说这种研究非常具有挑战性，但是什么样的直觉能帮助你找到操控数据和设置环境的方法呢？

John Schulman：我觉得有相当多的经验是关键。自从研究生时期以来，我一直在研究 RL 算法，涉及到数据收集、到注释过程，再到与语言模型的交互。所以，我算是涉猎了这些领域。我认为，在这类研究中表现出色的人通常对整个技术堆栈有全面的了解，并且对其中的各个部分充满好奇心。他们不仅依靠实验证据来更新自己的观点，还会从第一性原理出发思考问题。比如，假设深度学习是有效的，那么理想的收集数据的类型应该是什么，等等。

https://t.co/1mKH9v4Q1U

Markdown支持

评论加载中...

您可能感兴趣的：更多

OpenAI 联合创始人、研究科学家 John Schulman 认为，RLHF 才是 ChatGPT 的秘密武器（secret sauce）。训练数据的体量固然重要，但是让 ChatGPT 更容易推断出用户的意图，产生质变的根本原因是已在 InstructGPT（ChatGPT 前身）使用的 “人类反馈的强化学习（RLHF）” 技术。
Google…
IT技术
( twitter.com)

5个月前 • Barret李靖 • -- 点击 0 评论

1/ 关于 Worldcoin 最错误的说法：
OpenAI 创始人 Sam 创立了 Worldcoin😂。
因为他既不是前者的创始人也并不在后者担任实际职务。
我把最近挖出的材料缕一缕时间线，各位就清楚了：
币圈
( twitter.com)

1年前 • 0xTodd🦇🔊 • -- 点击 0 评论

来自BusinessInsider的报道：OpenAI 联合创始人 Ilya Sutskever 在公司中渐渐隐形，其未来前景扑朔迷离，内部人士称
- 尽管 Ilya Sutskever 为 OpenAI 做出了巨大贡献，但这似乎无法弥补他在 Sam Altman 被撤职事件中的角色。
- 目前 OpenAI…
IT技术
( twitter.com)

6个月前 • 宝玉 • -- 点击 0 评论

OpenAI 创始人 John Schulman 访谈节选：为什么 GPT-4 比一年前更“聪明”了？主要都是后训练（Post-Training）带来的！
IT技术
( twitter.com )

IT技术

来自 OpenAI 联合创始人 John Schulman 的观点：到 2025 年，AI 模型会更像你的同事而不是一个搜索引擎
AI
IT技术
( twitter.com)

IT技术

Adobe 联合创始人 John Warnock 博士去世，享年 82 岁
大陆资讯
( www.myzaker.com)

大陆资讯

OpenAI创始人Altman：GPT-5和GPT-6依然做不到AGI
大陆资讯
( wallstreetcn.com)

大陆资讯

OpenAI创始人投资半导体公司：对标英伟达，芯片尺寸比书大
大陆资讯
( www.yicai.com)

大陆资讯

OpenAI联合创始人兼前董事长Greg Brockman刚刚晒出一张OpenAI员工们的合照，并配文“我们终于回来了。”随后，OpenAI官方账号也转发了这张照片，并配文“没有员工的OpenAI就什么也不是。”
大陆资讯

大陆资讯

#新闻微软CEO纳德拉称，OpenAI创始人Sam Altman和原总裁Brockman将加入微软，领导新的微软AI团队；微软仍致力于与OpenAI的合作关系。
时政
( twitter.com)

时政

IT技术

1/ 关于 Worldcoin 最错误的说法：
OpenAI 创始人 Sam 创立了 Worldcoin😂。
因为他既不是前者的创始人也并不在后者担任实际职务。
我把最近挖出的材料缕一缕时间线，各位就清楚了：
币圈
( twitter.com)

币圈

IT技术

OpenAI 创始人 John Schulman 访谈节选：为什么 GPT-4 比一年前更“聪明”了？主要都是后训练（Post-Training）带来的！ IT技术 ( twitter.com )

IT技术

来自 OpenAI 联合创始人 John Schulman 的观点：到 2025 年，AI 模型会更像你的同事而不是一个搜索引擎 AI IT技术 ( twitter.com)

IT技术

Adobe 联合创始人 John Warnock 博士去世，享年 82 岁 大陆资讯 ( www.myzaker.com)

大陆资讯

OpenAI创始人Altman：GPT-5和GPT-6依然做不到AGI 大陆资讯 ( wallstreetcn.com)

大陆资讯

OpenAI创始人投资半导体公司：对标英伟达，芯片尺寸比书大 大陆资讯 ( www.yicai.com)

大陆资讯

OpenAI联合创始人兼前董事长Greg Brockman刚刚晒出一张OpenAI员工们的合照，并配文“我们终于回来了。”随后，OpenAI官方账号也转发了这张照片，并配文“没有员工的OpenAI就什么也不是。” 大陆资讯

大陆资讯

#新闻 微软CEO纳德拉称，OpenAI创始人Sam Altman和原总裁Brockman将加入微软，领导新的微软AI团队；微软仍致力于与OpenAI的合作关系。 时政 ( twitter.com)

时政

IT技术

1/ 关于 Worldcoin 最错误的说法： OpenAI 创始人 Sam 创立了 Worldcoin😂。 因为他既不是前者的创始人也并不在后者担任实际职务。 我把最近挖出的材料缕一缕时间线，各位就清楚了： 币圈 ( twitter.com)

币圈

IT技术

创建一个新帐户

登录

OpenAI 创始人 John Schulman 访谈节选：为什么 GPT-4 比一年前更“聪明”了？主要都是后训练（Post-Training）带来的！
IT技术
( twitter.com )

来自 OpenAI 联合创始人 John Schulman 的观点：到 2025 年，AI 模型会更像你的同事而不是一个搜索引擎
AI
IT技术
( twitter.com)

Adobe 联合创始人 John Warnock 博士去世，享年 82 岁
大陆资讯
( www.myzaker.com)

OpenAI创始人Altman：GPT-5和GPT-6依然做不到AGI
大陆资讯
( wallstreetcn.com)

OpenAI创始人投资半导体公司：对标英伟达，芯片尺寸比书大
大陆资讯
( www.yicai.com)

OpenAI联合创始人兼前董事长Greg Brockman刚刚晒出一张OpenAI员工们的合照，并配文“我们终于回来了。”随后，OpenAI官方账号也转发了这张照片，并配文“没有员工的OpenAI就什么也不是。”
大陆资讯

#新闻微软CEO纳德拉称，OpenAI创始人Sam Altman和原总裁Brockman将加入微软，领导新的微软AI团队；微软仍致力于与OpenAI的合作关系。
时政
( twitter.com)

1/ 关于 Worldcoin 最错误的说法：
OpenAI 创始人 Sam 创立了 Worldcoin😂。
因为他既不是前者的创始人也并不在后者担任实际职务。
我把最近挖出的材料缕一缕时间线，各位就清楚了：
币圈
( twitter.com)