商汤科技联合创始人、首席科学家、商汤绝影CEO王晓刚
编者按:腾讯汽车编辑部把过去十年的电动化浪潮称之为中国汽车工业的“狂飙年代”,如今,站在2024年这个被誉为“智驾元年”的历史节点,我们不禁要问:产业主要参与者将坚持怎样的技术路线?又如何构筑各自的竞争壁垒?腾讯汽车特别推出智驾系列策划,通过访谈、实测、横评、综述等多种方式,力求站在历史的原点,进一步洞悉汽车工业未来十年可能发生的巨大变革,为读者和行业提供更全面的内容导引,为行业留下部分历史注脚。
腾讯新闻《远光灯》
作者 傲敦
编辑 杨布丁
商汤闯入汽车圈,或许要感谢一场暴雨。
2017年夏天,商汤、本田和另一家公司的技术团队同时出现在本田日本测试场,本田要求商汤只用两颗摄像头完成车辆自动驾驶,其他团队则使用多传感器融合方案。
谁都没料到,演示那天下起了暴雨,那些依赖激光雷达、惯导、高精度地图的车辆彻底“罢工”。商汤用纯视觉方案,在恶劣天气条件下顺利完成了任务。
几个月后,商汤和本田签署了长达5年的合作协议,双方共研L4自动驾驶技术。
那日带队赢下项目的是商汤科技联合创始人、首席科学家王晓刚,现在他还有另一个新身份——商汤绝影CEO。从2017起,王晓刚便带着近四十人的团队一脚踏入眼下最卷、最残酷的行业:汽车圈。
2017年的智驾圈,Transformer等先进的网络结构尚未成熟,如今火爆的端到端更是没出现,自动驾驶技术路线、商业模式也都不清晰,多数以L4级为主,距离规模化量产还有一段距离。
直到2020、 2021年,商汤等一批新入局的智驾供应商终于看到了机会。当时国内车企多数用Mobileye方案,但它高度封闭,导致车企无法采集自己数据,车厂不得不尝试更多可能性。王晓刚回忆说,那时商汤看到了做量产智驾方案的机会,开始逐步加大对智驾的投入。2021年绝影品牌诞生,聚焦智能汽车领域。
闯入汽车圈后,商汤绝影经历了波折且痛苦的转型过程,但最终还是成功交付,完成了第一阶段蜕变。如今,特斯拉FSD入华已箭在弦上,但在王晓刚看来,这是商汤绝影一个机会点,“车企跟我们深度合作,会是在AGI时代取得成功的最佳路径”。
“中国车企和科技公司的合作闭环里,不能只是会解bug。”王晓刚认为,双方需要建立“你中有我,我中有你”的模式,共同打造一个可升级、可迭代的研发体系,即AI时代的基础建设。
从2014成立那天起,商汤一直在聚光灯下,那里有一群顶尖科学家,曾被称为“AI四小龙”之首。但成立十年来,商汤一直在探索如何通过技术变现来养活自己,按照王晓刚说法,“压力还是很大的”。他对绝影团队说, “只有半年的生命,半年之后可能再续命”。
以下是腾讯新闻《远光灯》与王晓刚的对话,经编辑:
“在今天,汽车成了AI最大的牵引动力”
《远光灯》:我比较好奇,你从学术界转到工业界,今天又进入到汽车这个特别卷的行业,有什么感受?
王晓刚:我是2016年从学校进入到商汤,大家很多时候都觉得商汤是教授从实验室出来创办的公司,那里面学术氛围比较浓,不接地气。其实不是这样,从商汤建立那天起,你就必须得通过技术变现来养活自己,压力还是非常大的。所以,那时候开始我负责研究,很快开始接触业务,包括当时跟本田的合作,手机业务、互联网业务我都负责过。
今天我们说汽车行业“卷”,其实手机市场 “卷”得更早。在手机业务市场,我们经历过比较残酷的、激烈的市场竞争,记得当时我们大年初三就到岗,跟友商PK非常激烈,好在我们在技术比拼方面比较有优势,最后我带队拿下了订单。
另外,我们最早接触的本田项目也是我带着团队最终赢下来的。当时有一个展示前端技术的活动,本田的社长等高层都在场,本田要求我们就用两颗摄像头,在本田日本测试场里能够完成自动驾驶。
那天有我们和本田自己的团队、还有一个外部团队,他们用的就是激光雷达、惯导、高精度地图。演示那天下起了暴雨,那些强依赖于这些传感器和硬件设备的团队,整个就不能工作了。最后我们商汤纯视觉方案,就用两个摄像头,还是在恶劣天气条件下顺利完成任务,最终赢得了这个项目。
商汤是经历了很多考验,但是进入汽车这个行业后,我们发现竞争更加激烈、更加残酷。到淘汰赛阶段,车厂对交付、质量要求、deadline的限制,这些要求都特别高。我们也经历过项目交付的各种挑战,我跟团队一块驻场,跟客户一起完成的。我觉得,这些都是必经的过程,商汤和绝影也都是在这样的过程当中成长起来的。
《远光灯》:“AI四小龙”里,其实你们是最早坚定的进入到汽车产业的公司,这是为什么?
王晓刚:这跟创始人对于每一个公司的未来和定位是息息相关的。商汤是一家人工智能平台公司,因为AI的发展是有周期的,跟行业密切相关,所以不同行业依次会形成AI的推动力,AI的发展需要某些行业来进行牵引。
在今天,我们看来,汽车就成了AI最大的牵引动力。但是,若干年前那就是智慧城市、手机和互联网,它们是AI的动力。商汤其实都有前瞻性的布局,作为一个平台公司,商汤也是随着行业的变化和发展,往前演进。
今天汽车作为非常重要的板块,我们需要深耕下去,大模型无论是在智能驾驶还是智能座舱领域,它都是有非常好的、比较明确的落地场景。
将来,这些技术可能又能够被机器人所复用。只不过今天,机器人的量产数量是非常少,汽车有比较庞大的量产群体给你提供反馈,去打磨你的技术。
《远光灯》:所以对于商汤这类AI公司来说,下一个风口行业就是机器人?
王晓刚:对于绝影来说,我们会扎根在汽车这个方向。商汤本身,它不会一直就只停留在汽车这个方向,它还会再往前走。因为人工智能技术本身也还在演进过程当中,我们就会一直深耕下去。
《远光灯》:目前你们在算力层面的储备是多少?
王晓刚:在算力层面,商汤从2018年开始布局建设AI基础设施,在上海临港投入了超50亿元建设智算中心AIDC。商汤大装置已经布局全国一体化的智算网络,运营54,000卡GPU,总体算力规模达20,000 petaFLOPS(每秒千万亿次浮点运算次数,下称“P”)。
其实,国内大多数车企的算力储备尚未突破2,000 P,所以说,我们充足的算力资源为UniAD自动驾驶方案的高效训练学习和实车部署奠定了坚实的基础。
《远光灯》:商汤大装置和基础设施会给到绝影什么样的支持?
王晓刚: 我们的合作非常紧密。首先,像基础设施,也就是我们说的大装置,算力平台、数据存储等,因为自动驾驶,尤其是端到端对于数据存储要求非常高,因为都是视频片段。
在端到端早期训练过程中,我们遇到了很多困难,中台部门跟我们一起进行反复迭代;另外,大模型、多模态大模型等很多方面,商汤产研部门会进行支持,包括最新的日日新5o流式多模态大模型。我们把商汤在大模型上的这些突破运用到车载的领域。
自动驾驶量产交付是考验的第一步
《远光灯》: 从最早的本田项目再到绝影品牌,你们是怎么确定的这个方向?
王晓刚:我们是从2016、2017年开始了智驾方面的研发。当时本田来中国寻找智驾合作伙伴,他们看了很多公司。当时商汤整个体量还比较小,做智驾的研发人员也就三四十人,但本田非常看重商汤在基础设施、训练框架等方面的能力和创新能力,所以最终选定跟我们合作。
本田当时给我们提出的目标跟今天的端到端自动驾驶非常像,就是纯视觉,只用摄像头、没有高精度地图,不使用激光雷达,直接根据视觉去预测输出驾驶轨迹。在当时,像Transformer等先进的网络结构还没有成熟,无论是端上的算力还是云上的算力,也都不具备相应条件。
另外,早期自动驾驶的技术路线、商业模式也都是不清晰,那时候虽然有很多自动驾驶公司,但大多数以L4级的自动驾驶为主。
直到2020和2021年,我们在智驾方面看到了一个契机。一些国产车厂之前大多用的都是某厂商的方案,它是高度封闭的,甚至车厂连自己的数据都没有办法采集到,就只能给到某厂商。所以,一些新的供应商获得了一个契机,为车厂去做量产智驾解决方案。从那时开始,商汤开始逐步加大对智驾的投入,2021年,商汤就有了“绝影”这个名字和品牌。
《远光灯》:当时你们内部有没有产生过什么争执或者犹豫过?对你们来说这是一个比较大的转型。
王晓刚:2021年商汤上市之前,我们内部针对智驾做过比较大的讨论,因为智驾投入是比较高的,而且有很强的不确定性,风险比较高,但是汽车给AI带来的牵引动力会是巨大的,最后我们还是下决定要做。所以到2022年,我们就成立了绝影智能汽车事业群,由我来负责。
另外,这几年商汤逐渐加大智能汽车领域的投入,因为我们也看到一些比较清晰的商业模式,跟主机厂合作去提供量产方案,这是一个趋势。到2022年年底,我们提出了端到端UniAD的解决方案。
同时,2022年年底,ChatGPT出圈了,大家对大模型开始有了认知。其实在2022年一整年,我们给各个车厂推的就是智驾大模型,现在看来确实是太超前了。
所以到了2023年,我们绝影继续加大这方面的投入,包括UniAD端到端自动驾驶,车舱大模型应用。在这个过程中,绝影逐步找到了自己在整个行业中的定位和未来发展方向,同时商汤本身在基础设施大装置方面的优势也更加清晰。
《远光灯》:刚开始的时候你们有没有制定一个目标或者打法?
王晓刚:具体看业务本身,座舱相对来说“轻”一些,交付速度会快一些,现在我们的市场覆盖度还比较高,有30多个车厂合作。智驾业务比较“重”,从未来发展趋势看,其实是要求合作伙伴跟车企有一些比较深度的合作。
尤其在今天的端到端时代,我们的目标是能够寻找几家重点车企形成战略合作,因为车企有量产车,有比较丰沛的数据,而我们商汤绝影有包括算力和数据生产管线在内的基础设施,双方能够打通整个闭环。
这是比较重要的,因为汽车市场竞争比较激烈,未来还会进一步聚焦,我觉得重点不是说贪多,而是要一些形成闭环、战略合作。
《远光灯》:商汤是一家AI公司,你们是怎么说服更多车企客户跟你们合作的?
王晓刚:我们这样的AI公司作为供应商进入汽车行业,在量产交付上一定要实现一个蜕变。从整个行业看,2021年到2023年大家刚开始做自动驾驶量产交付、开始转型,我们有三个量产交付的客户其实都很关键,就是广汽、合众和一汽。
很多时候,实际上是我们客户帮着我们成长的,因为他们有各种流程、工作方式的要求,这个转型过程是非常波折和痛苦的,但最终还是成功交付了。
所以我觉得在那个阶段,经历量产的考验是第一步,是里程碑,绝影完成了蜕变。
我为什么说我们“只有半年的生命”
《远光灯》:听说你跟团队说“只有半年的生命,半年之后可能再续命”,这是什么意思?
王晓刚:在汽车行业,我们学到最多的就是结果导向。最终你要去看结果,你的量产交付质量、时间点,在一个项目里面,我们做软件可能是最后一环,那前面还有很多环节,最后到我们这是后墙不倒。
具体到自动驾驶,它又是一个技术栈特别深的的方向,要依赖的环节很多,所以要给大家梳理,要结果导向,守住自己的每一班岗。说的再好、再怎么样天花乱坠,最终还是要结果。
对绝影来说,我们敬畏客户,取得他们的信任和友谊,形成持久的战略合作,这是因为我们在关键时刻能够去交付好的结果。
汽车行业你也知道,很多时候有一款车没有做好,可能关系到这家公司的生死存亡。之所以我说半年的时间,是因为在汽车行业经历的特定的时间点上,产业的演进速度与竞争格局是非常激烈的。
只有半年的时间,并不是说没有钱了、没有现金流了。而是说,当你的技术落后了,或者是没有去交付好的时候,半年以后你可能就没有客户了。没有客户,你自然就已经是被市场抛弃了,那么无论你是有多大的团队规模、多少现金,其实都是面临着被淘汰的危险。
所幸的是今天我们是有机会的,但我们要时刻提醒自己,这个机会也是稍纵即逝的,因为大家演进的速度都非常快。
大模型上车、端到端自动驾驶,在这个时间窗口里面,如果你不能够拿出市场上认可的产品和技术的话,那就会被淘汰。
[第一车市新闻] 商汤科技联合创始人、首席科学家、商汤绝影CEO王晓
[第一车市新闻]岁月不居,时节如流。自2005年首次璀璨亮相,中国国际铝
[第一车市新闻]区域集散市场在推动城市发展、保障民生民用的
[第一车市新闻]在新法规新政策的影响下,两轴中卡载货车无疑是
[第一车市新闻]近日,商车邦在位于北京怀柔的北京超级卡车体验