张小珺Jùn|商业访谈录 podcast

115. 对OpenAI姚顺雨3小时访谈:6年Agent研究、人与系统、吞噬的边界、既单极又多元的世界

0:00
2:31:32
Retroceder 15 segundos
Avanzar 15 segundos

今天的嘉宾,我们很开心邀请了OpenAI研究员姚顺雨。

2025年4月,姚顺雨发布了一篇有名的博文《The Second Half》,宣告AI主线程的游戏已进入下半场。这之后,我们与他进行了一场播客对谈。

姚顺雨毕业于清华和普林斯顿大学,开始智能体的研究非常早。在博士期间他意识到语言可能是人类发明的最接近本质的工具,于是转向语言智能体研究,至今已6年。他有许多有代表性的工作。

我们的谈话从个体出发,共同探索由人、组织、AI、人与机器的交互,所抵达的这个世界智能的边界以及人类与机器的全景。

前不久,我刚刚创立了一家新的内容工作室「语言即世界工作室」,顺雨很意外地从另一个角度帮我回答了,我们工作室创立的初心。

为什么我们相信语言是这个世界的本质奥秘?他的表达是:“语言是人为了实现泛化而发明出来的工具,这一点比其他东西更本质。”

(本次访谈发生在2025年5月,访谈为个人观点,与所供职公司无关。)

02:58 第一部分:人
  • 感觉我前28年的人生,非常的乖
  • 我一直有这个非共识:我想要去做Agent
  • 第一年最大收获是,要用GPT,不要用BERT;第二个learning是任务或环境非常重要
  • 我的研究有两个核心:一是怎么去做一些有价值、和现实世界更相关的任务和环境;二是怎么去做一些简单、但又通用的方法
17:50 第二部分:系统
  • Agent是一个非常古老的概念,任何能进行自我决策、与环境交互,并试图优化奖励的系统,都可以被称为Agent
  • Agent演变的三波兴衰:大家可能更多注意到方法线,容易忽视任务线,但这两条线是相辅相成的
  • Agent发展最关键的两个方向:一个是让它拥有自己的reward(奖励),能自己探索;另一个是Multi-Agent(多智能体),让它们之间能形成组织结构
  • Code有点像人的手,它是AI最重要的affordance(环境给予行动者的可能性)
  • 任务的设定
  • 泛化的工具
  • 奖励的机制
48:38 第三部分:吞噬的边界
  • 创业公司最大机会是:能设计不同的interface(交互方式)
  • 可能模型的能力会产生beyond ChatGPT(超越 ChatGPT)的交互方式,变成Super App
  • 拥有一个Super App对于公司是双刃剑,当你有像ChatGPT这样的Super App,很自然你的研究就会围绕这个Super App
  • Assistant、Her,或者像人一样的交互方式,显然是最重要的交互方式之一;不显然的是,我能不能基于不像人的交互方式?
  • 这世界是个相互抄的关系,而不是一个单向抄的关系
  • OpenAI可能会成为一个类似Google的公司,成为新世界里非常重要的一环,但这并不代表,这个世界就会被这样一个单极系统垄断
  • 最终的智能边界,是由不同的交互方式决定的,而不是由一个single model(单一模型)决定
  • 前年冬天,我读到冯诺依曼临终前写的一本书:The Computer and the Brain
  • 环境永远是记忆层级中最外层的部分,这很哲学
  • 模型公司的Chatbot系统会演化成一个很自然的Agent系统
01:05:01 第四部分:人类的全局
  • 人与系统:Agent要不要像人?“是一个效用问题”
  • OpenAI是一个bottom-up(自下而上)的公司
  • 如果你没有一个different bet(不同的下注方向),很难超越前面的霸主
  • 我导师是GPT‑1第二作者,他在OpenAI待了一年,他对这件事是有点怀疑的
  • 如果你成为了伯克希尔的CEO,未来要拿出500亿美金allocate(分配)到AGI行业,你会怎么allocate这笔钱?
  • 真正的危险,不是一个类似微信的东西打败了微信,而是一个不一样的东西打败了微信
  • 恰好这个时代,做上限更高的事更好

【更多信息】

文字版同步上线

文字版请前往公众号:语言即世界language is world

Otros episodios de "张小珺Jùn|商业访谈录"