晚点聊 LateTalk podcast

77: 不仅是车企的战争,与 Momenta 创始人曹旭东聊智驾供应商生存法

0:00
1:21:31
Rewind 15 seconds
Fast Forward 15 seconds
本期节目,我们访谈了智能驾驶供应商 Momenta 的创始人曹旭东。 Momenta 是曹旭东第一次创业,他 8 年前成立这家公司时刚满 30 岁。这之前,曹旭东在清华学物理,后来获得直博机会,但他中途从清华退学,转而去微软亚研院做 AI 视觉研究;2014 年,他加入了刚成立的商汤,创业前,他是商汤的研发总监。 在 2020 年之前, Momenta 都谈不上耀眼,它好像从来没成为过智驾行业里的 AI 四小龙或大模型五虎般的存在。而在 2021 年,这家公司却在一年里融了 10 亿美元,它的大部分融资都发生在这一年。 背后的逻辑也简单:特斯拉在 2020 年大卖,仿佛一夕之间,量产高阶方案就被接受了,而 Momenta 一直在做这件事,过去没什么反响,如今有了客户,而且是最多客户——目前 Momenta 手里有最多的智能驾驶车型定点——包括上汽智己,这是 Momenta 的第一个大客户,还有后来的比亚迪、广汽等等,数量超过了华为。 所以现在智驾行业里有一个新组合,叫“地大华魔”,指地平线、大疆、华为 和 Momenta,它们被认为是智能驾驶供应商里的头部玩家。 现在这一批 AIGC 公司的故事有些像自动驾驶的昨天:极高的期待,大额的融资,优秀的人才,在短时间里汇聚到一起。而一批智驾公司的今天,则展现了一个黑科技领域发展 10 年后可能会是什么样子。 我们和曹旭东讨论了 2023 年以来智驾领域的诸多变化,以及 Momenta 的策略与选择。这个行业还有很多悬念:车企与智驾供应商应该如何分工?在端到端大模型的大方向下,怎么选择具体的技术路线?未来市场格局会有多集中?能容纳多少公司?活下来的公司会是什么形态? 这次访谈的文字版,之前已经发布在《晚点》的公众号上,可见 shownotes 里的链接。 时间线传送: ·FSD 半年进化了几十倍,智驾在买车决策里更重要了 03:10 一年半前最担忧的事是 L2+ 不能真的帮车企卖车 04:12 技术进步,华为问界的催化改变了局面 07:07 部分车企等不及自研,更积极用供应商 08:41 FSD 进中国为是好事,卷价值,而非卷价格 10:07 欧美客户试乘后的评价 12:01 智驾公司盈利的条件 12:46 如何衡量智驾供应商的位置?体验、客户质量、客户数量 13:57 三维度对比,华为 vs Momenta ·超越智驾摩尔定律,未来第一名会占 70% 市场份额 16:31 智驾摩尔定律:每两年硬件 BOM 成本降一半,软件性能提升 10 倍 17:42 产业链定位,为什么 Momenta 做 Tier 1(直接给车企供货的一级供应商),而非 Tier 2? 18:56 整车追求差异化,智驾则没有差异化,只有好与更好 20:10 垂直整合,原因与边界 21:54 价位下探,未来 15 万的车也会标配高阶智能驾驶 22:34 和高通合作则不仅为性价比,也为上油车、混动 23:41 同时和英伟达、高通合作,什么体验? 25:26 低水平竞争可能会在两年内结束 27:17 智驾出海的机会和挑战 ·端到端不难,难的是做高端到端的下限 29:02 端到端大方向下可能有 10000 条路 30:17 Momenta 开发端到端:用神经网络做感知→用神经网络做决策(deep learning planning)→感知、决策合成一个大模型 32:07 2021 年底的重要选择,当年底交付的方案到底用模型方法还是用规则方法? 35:39 新方案如何让客户信任 38:36 做出端到端不难,提高下限难,这是个体系工作 40:49 如何提高持续做对技术判断的概率?——低成本短周期试错 44:23 “正确的大方向”举例:围绕交付建立高效体系 46:11 短期压力导致短期救火,导致团队崩溃,坚持主线产品不分叉很重要 ·“做有杠杆的事” 51:11 多发钱、高人效 51:45 Momenta 如何从 400 人交一个车型到现在几个人交一个车型 53:40 公司现在最大的杠杆,产品能和技术 54:37 组织目前的杠杆:持续招到和晋升更好的人 58:16 把公司战略穿到身上 01:00 重要决策来自小会议,人数一个车上能坐下 01:02 成为最终头部的挑战,全球化 01:03 在六道口试乘无图端到端,车上聊天 相关链接: 对话 Momenta 曹旭东:超越智驾的摩尔定律 https://mp.weixin.qq.com/s/QAZvo8xNw8UyIotyer7rEw 本期人物: 曹旭东,没有驾照的智驾公司创始人 程曼祺,晚点科技报道负责人,即刻/小红书:曼祺_火柴Q 剪辑:甜食 附录:自动驾驶图示 & 播客中提到的一些术语 https://cdn.z.wiki/autoupload/20240808/xDyU/1080X870/640.webp 自动驾驶有感知(Perception)、规划与决策(Planning)和控制(Control)三个模块,靠感知 “看”,靠决策 “思考” 怎么开车,靠控制模块完成驾驶行为。 端到端技术现在一般指从感知到决策,整个过程用一个大模型实现。 而过去的智驾技术系统,尤其是决策模块会使用大量编程写就的规则,而不是用深度学习来做。 我们在播客中聊到,Momenta 做端到端的过程,是先用深度神经网络做了感知,这是 2021 年之前很多公司就能做到的事,接着是在 2022 年用深度学习做了决策,也就是反复提及的“deep learning planning”,之后在 2023 年把两个分段的模型合成了一个端到端模型。 扫描二维码,可关注《晚点 LatePost》: https://0.z.wiki/autoupload/20240808/nlN5/1050X1164/%E6%99%9A%E7%82%B9%E4%BA%8C%E7%BB%B4%E7%A0%81.jpeg

More episodes from "晚点聊 LateTalk"