专访友道智途衡量:技术人的二次成长,从仰望星空,到脚踏实地

雷锋网  •  扫码分享

衡量在 2021 年面临一个选择:是再次创业,还是加入一家成熟的大公司做自动驾驶?

他最终选择了友道智途——一家从上汽前瞻spin off出来的初创公司,天使轮股东有上港、海尔、普洛斯、国电投、江苏交控、自贸区基金、山东港这些产业相关方,专注于港口、干线物流、工业园区、矿山等场景的L4 级自动驾驶——担任首席科学家和智驾中心总经理。

友道成立前,时任上海市委书记李强亲自推动上汽前瞻和上港合作东海大桥上的L4智能重卡。

友道成立一年后,现任市委书记陈吉宁上任。颇有缘分的是,在衡量十多年前的清华大学毕业典礼上,正是陈校长为他拨穗正冠。“这种缘分很奇妙,”衡量说,“但更关键的是,他们都是自动驾驶技术的坚定支持者。”

友道智途拥有大多数自动驾驶公司梦寐以求的资源:中国 30%主流港口的潜在客户,以及上汽集团的支持。

对衡量而言,友道代表了一种“技术务实主义”——不再只是追求前沿算法的突破,而是让自动驾驶真正在商用场景和财报上跑通。

“我需要一个能弥补短板、发挥长处的环境。”衡量说。他的技术能力毋庸置疑,但港口和物流是一个 to B 和to G 的市场,客户资源、政府关系和技术一样重要。友道的股东背景,让他不必像在以前的创业公司那样疲于找客户,而是能专注于技术落地。

这种“务实”也体现在研发方式上。

友道的工程师驻扎在码头附近,他们的算法不是在会议室里讨论出来的,而是在观察龙门吊的作业节奏、倾听卡车司机的抱怨后,一点点调整出来的。

例如,AIV(Autonomous Intelligent Vehicle,无人智能集装箱转运平板车)取消了驾驶室,采用双向对称设计,不是为了技术炫技,更是为了解决集装箱方向错误时的效率问题——在传统码头,这一环节需要额外的工序来调整。

“我们早过了做 demo 应付投资人的阶段,而是要让每辆车每年实实在在地挣到30万元。”友道导航负责人江灿森说。他与衡量的合作始于 2019 年的大疆时期,从过去的 L4 级乘用车到如今的 L4 级商用车,多年搭档,他们最大的感慨,“完成了从‘仰望星空’到‘脚踏实地’的蜕变。”

如今,当 170 人的精干团队支撑着 400 多辆无人车的常态化运营,从上海罗泾码头到秘鲁钱凯港,从集装箱运输到矿山散货,这套经过验证的商业模式正在持续复制。

专访友道智途衡量:技术人的二次成长,从仰望星空,到脚踏实地

(2024年10月友道智途团队在秘鲁钱凯港开启试运营)

以下为雷峰网和衡量、江灿森的对话,并做了不改变原意的编辑:


01 顶层设计:「平台化」背后的技术哲学,一套代码如何征服矿卡与集装箱港?


雷峰网:你在友道这四年,可以分为几个阶段?

衡量:可以分成三个阶段。

第一个阶段是打造 L4 自动驾驶能力。

我们自研了友道智途智驾系统,当时主要项目是上海东海大桥和外高桥4号码头(简称外四码头),项目很少,但智驾团队人数一度达到 330 人,因为这个阶段主要是构建整个 L4 自动驾驶车队的能力,从单车智驾到云端调度系统、车队管理系统,所有能力都是在这个阶段构建的,大概持续了一年半。

第二个阶段是应用场景迅速扩大。

我们将之前在重卡和 AIV两个车型上成功的自动驾驶技术应用到更多场景,比如AIV从上海的集装箱码头拓展到福建、广东、山东、河北的码头,甚至到国外的秘鲁。秘鲁的项目很知名,习近平总书记 2024 年 11 月还亲自视频参加了开港仪式。

同时,重卡的场景也从东海大桥拓展到工业园区、散货码头、矿山,从结构化道路拓展到非结构化道路。车队规模从不到 100 辆车,到 2024 年年底有 400 多辆,2025 年可能会有 500 多辆。

这个阶段主要是场景迅速扩大化,把技术复制到新场景,并针对新场景做对应的开发,让技术变得更加泛化、更加通用,适用于各种商用场景。

第三个阶段,也就是最近一年的重点,是我们已经成规模地运营起来了,重点是要提升运营效率。

一方面,智驾技术本身的表现要接近人类司机的表现。比如在码头,人类司机 20 分钟可以完成一圈运输,我们也需要做到类似的效率。

另一方面,运营人员要尽可能少,管理尽可能多的车。

目前车人比最高的场景在上海罗泾集装箱码头,90 辆车每班只有 3 个人管理,其中1人是远控司机,无论是 30:1 的车人比,还是 90:1 的车辆远控比,在目前全世界的 L4 实践中都是非常高的。

专访友道智途衡量:技术人的二次成长,从仰望星空,到脚踏实地

(友道智途的AIV正在上海罗泾港中运营)

雷峰网:这几个阶段难度不一样吗?

衡量:三个阶段各有各的难点。

第一个阶段,从零打造一个自动驾驶系统,应该是相对最简单的,因为我之前已经做过几遍了。当然,每做一遍都是一次重构,要结合当前的硬件设备和算法进步,以及场景需求,做出新的改进。

第二个阶段也有很多难点,主要是先做好一个场景,再将已有的场景经验迁移到其他场景。

做个对比,商用车车型和场景与乘用车不一样。乘用车场景再多,也就是高速和城市,做好高速 NOA 和城市NOA 就差不多了,任务也比较简单,主要是 A 点到 B 点的运输。而商用车的情况要复杂得多一一在码头,要设计与码头吊机的对位和交互流程,应对各种交互异常;在矿区,要涉及自己去找挖机和排土位置。

但我们不可能为每个场景做大量定制化开发,关键在于如何用有限的人力,通过在原有平台化功能的基础上,让技术更加泛化,找到各个场景的共性。所以从第一个阶段开始,就要做好一套“平台化”的基础技术架构一一所有车辆和场景用的都是同一套代码,各种算法尤其是神经网络必须足够泛化,才能用尽量少的研发资源应对众多不同的场景和车型。

第三个阶段依然充满挑战,主要在于优化实际运营中的效率。

比如车辆要能自动去充电,还要应对商用车传感器位置的微小移动一一商用车体积大,传感器在运营一段时间后会出现轻微偏差,需要重新标定。以往的自动驾驶公司都有专门的标定场或人工标定,但我们不能把车拉回来标定,而是要在现场利用自然环境进行标定,让车辆自己采集数据、自己标定自己。

此外还包括车辆的充电和日常养护维护,全流程都要做到自动化。

这些在以往都是难以想象的,但我们都研发出来了。目的是为了提升运营效率、尽可能减少现场人员数量。

雷峰网:在设计第一阶段的自动驾驶系统时,与过往不同的是什么?

衡量:友道成立在 2021 年11月,一方面当时 Orin 芯片的出现使得L4 和 L2+ 的算力平台趋同——以前做 L4用的是工控机和数百TOPS的显卡,辅助驾驶用的是几十甚至几TOPS的车载算力芯片。另一方面,激光雷达开始降价,成本降低。

加上当时我们有一个非常平台化的计划,就是用一套代码适配所有车型和场景。甚至当时我们考虑要连乘用车的高阶辅助驾驶系统,以及典型 L4 场景如港口、矿区和非结构化道路都一起做。

高阶辅助驾驶系统不依赖高精度地图,而所有 L4 场景通常更适合使用高精度地图,所以,无图方案和有图方案都要在这套系统中结合和融合。在我看来,友道智途的智驾系统应该是过往所有自动驾驶经验的集大成者,它融合了我之前做 L4、L2+ 的所有经验。

雷峰网:怎么理解你们融合了高精地图和无图?比如什么情况下会切换模式?

衡量:目前所有实现无人运营的场景都是基于高精度地图的。

正常情况下,当车辆定位良好且所有模块正常工作时,我们会给予高精度地图极高的权重。实时路网结构主要用于辅助定位,与高精度地图信息进行匹配,以更精确地确定车辆的当前位置。

但友道智途的智驾系统本身支持无图方案。也就是说,当车辆进入降级行驶模式,比如车载传感器出现故障,或因震动导致传感器短时失效,无法依赖高精度地图时,车辆会切换到实时构建的路网结构,进入无图模式,依靠实时感知来完成路边停车等功能。


02 场景选择:从干线物流到矿山港口,场景倒逼的技术革命


雷峰网:友道成立之初,确定的场景是港口和干线物流,现在变成了港口和矿山吗?

衡量:对。

东海大桥更像干线物流,外四码头的平板车 AIV 属于港内水平运输的场景,这是最初的两个场景。

在最初考虑场景时,高速干线物流的优先级很高,因为整个运输市场中干线运输的市场规模非常庞大,达到 5 万亿,远超网约车、城配等其他市场。但在后续项目扩大、业务拓展,以及追求技术盈利性时,高速干线的优先级已经大幅降低。

可以说,高速干线的权重降低主要是因为其盈利性较差。目前中国高速干线物流模式仍以私人自有车辆(如夫妻档)为主,这种模式已经把物流成本压得很低。这个时候,车辆哪怕已经实现了 L4 自动驾驶,但如果由公司运营车队去和目前的私人个体户车辆竞争,成本依然不具优势,就会亏钱。

目前,我们几乎只有上海东海大桥这一个高速干线场景。

我们要本着可持续发展的原则,先把盈利的场景做好,获取足够利润后再去支撑那些盈利性更差的场景。我相信随着中国未来的劳动力成本上升,高速干线物流的盈利性会变好。

雷峰网:港口和干线物流的车辆形态很不一样吗?

衡量:港口的车可以设计为双向对称,就是双向都可以跑。

在港口作业中,集装箱有一个关键的细节——调箱门。集装箱一端有箱门,在实际操作中船舶、堆场对箱门的朝向一般会有要求。当车上的箱门朝向错误时,无法直接卸箱。为此,传统港口作业中不得不专门设置“调箱门”环节来调整方向,需要购置专门的调箱门起重机,不但增加成本,还降低了作业效率。

而友道的AIV完美解决了这个问题一一没有传统驾驶室,不分正反方向,车两端的传感器和驾驶能力完全一致,8 个轮子可以灵活双向行驶,甚至实现漂移蟹行换道。当集装箱摆放方向错误时,车辆只需反向行驶即可,完全省去了专门的“调箱门”调整步骤。

和港内的无人平板车不同,干线上的车还会保留驾驶舱。尽管在东海大桥上的车辆已经进入无人运营阶段了一一 2024 年是无人示范应用,2025 年已经开始真正的无人示范运营,安全员已经开始逐步从车上转到后台了。

雷峰网 (公众号:雷峰网) :你们将港口车辆命名为AIV(Autonomous Intelligent Vehicle,无人智能车)是吗,意思是无人纯电港内集装箱智能平板车,在此之前,也有商家提过AGV( Automated Guided Vehicle ,自动引导车)名字是吗?

衡量:港口车辆分为内集卡和外集卡。

内集卡用于港内运输,将集装箱从岸边转运到堆场;外集卡则从港口外接箱后运出。我们主要做的是内集卡,因为内集卡完全在港口内运营,不会出港。

传统上,内集卡是人工驾驶的,由于港内运输速度较慢,通常使用重载版4X2集装箱专用卡车。

从 1997 年鹿特丹第一个自动化码头出现后,开始使用类似 AGV 的四轮或八轮平板车作为内集卡。这些车辆是由工程机械制造商生产的,如国内的振华、三一等,而非汽车制造商。这些车辆的架构属于工程机械体系,而非汽车体系。

友道的 AIV 的一大优势,在于我们自己生产和制造。

二是,AIV 将 AGV 升级为具有自主智能的车辆。

我们在设计中一方面优化了AGV的结构,另一方面采用汽车行业的方式制造 AGV 。虽然外观上看起来像八轮车,与 AGV 相似,但在悬挂、动力、刹车、底盘转向等系统方面,更接近商用车。

三是成本方面也降低了很多。

以前的AGV ,每台价格大几百 万人民币,而我们从一开始就将成本控制在 200万人民币,经过不断优化,现在成本已经低于 100 万人民币。

专访友道智途衡量:技术人的二次成长,从仰望星空,到脚踏实地 专访友道智途衡量:技术人的二次成长,从仰望星空,到脚踏实地

(AGV依赖磁钉来定位,且只能沿着预定的路径行驶(左图);友道的AIV可以在港口内闪转腾挪(右图))

雷峰网:主要在哪方面降本?

衡量:磁钉是传统 AGV(自动引导车)的方案,AIV 取消了磁钉。

传统 AGV 的感知能力较弱,早期的 AGV 甚至没有激光雷达,比较新的AGV可能只有单线激光雷达,只能做简单的防撞。AGV的运营要求非常高,场地内不能有其他车辆或人员穿梭,因为这些车辆几乎是“瞎”的,无法感知其他障碍物。

AGV如何确定自己的位置呢?

主要依靠地下埋设的磁钉,维护成本也非常高,还需要专门的磁钉传感器(一般叫transponder),这种传感器价格不菲。AGV只能沿着预定义的轨道和轨迹开,而且所有车都依赖于中心车队管理系统的调度,才能确保相互之间不会碰撞。

AGV方案大概是从2000年开始用,一直用到2020年代初,现在愿意用AGV方案的客户已经很少了。

比如有很多客户需要把在运营的集装箱码头升级成自动化的,他们无法接受停工停产数月,全场挖开埋磁钉。

雷峰网:所以现在你们在港口打造了一个什么样的画面?

衡量:我们在港口的场景中可以做到车辆在人来人往、各种车辆穿梭的环境中不受干扰地运货。

很多人会觉得这种限定场景的L4自动驾驶非常简单,但事实上港口场景相当复杂。我们的车可以在路口与七八辆有人驾驶的集卡车挤来挤去,灵活穿梭,避让其他车辆并预测它们的意图。

雷峰网:港口场景和成本、安全密切相关,我看到你们在深圳的妈湾港,已经有 40 辆无人车在运营,每月转运 5 万 TEU (集装箱吞吐量),所以你们已经从“能用”到“好用”再到“盈利”的阶段了。

江灿森:可以明确地说,自动驾驶技术已经跨越了早期项目的“Demo演示”阶段。过去那种“立项、拿经费、组建团队、堆技术、搞演示”的模式,在领导视察时让车辆在固定路线跑几圈就过关,这已经成为历史了。

我们现在做的,是构建常态化的运输服务体系。无论是有安全员辅助还是完全无人的模式,核心目标都高度聚焦于高效、安全地完成运输任务——例如,实现无人集卡从码头面到堆场的灵活穿梭和精准调度。

这个转变意味着,靠“技术做到80分就能交差”的时代彻底终结了。现在真正的挑战在于,如何将技术从95%的可靠性提升到98%、乃至100%。这最后的5%,往往是最难的“长尾问题”,需要耗费巨大的研发精力来解决。这也正是当前L4级自动驾驶实现规模化落地的主要瓶颈。

我们的目标非常明确:让自动驾驶技术真正转化为生产力,切实解决客户痛点。同时,产品必须持续迭代优化,解决那些影响体验和效率的细节问题。就像刚拿到驾照的新手,确实能把车开动、开到目的地,但与经验丰富的“老司机”相比:驾驶过程还不够流畅顺滑,对环境的预判不够精准敏锐,在复杂场景(如灵活变道、避让)中的处理能力还有差距。当前的自动驾驶也处于类似阶段:我们具备了基础运载能力,但在追求极致效率、接近甚至超越人类驾驶员水平、以及面对全场景无缝适应方面,仍有提升空间。

因此,持续攻坚长尾问题,打磨产品,提升系统的鲁棒性和全场景适应能力,是推动自动驾驶从“能用”迈向“好用”,再到“商用”的关键一步。

雷峰网:以前有说法,如果能在非常复杂的场景下做好 Robotaxi (L4级的乘用车),那么迁移到其他场景应该只会做得更好。你们两位都有做 L4乘用车和商用车的经历,我想知道,你们亲身感受,技术真的可以迁移吗?

江灿森:在加入友道之前,我原本以为同样是做 L4 级自动驾驶,不同行业之间应该颇为相似,但实际接触后才发现,不同场景的侧重点存在显著差异。

过去,我们作为司机或乘客,对乘用车自动驾驶的认知往往停留在 “能在高速、普通道路安全行驶即可”—— 这个过程中,车辆很少需要像友道业务场景这样,与各类终端设备产生深度交互。

普通家用车车身宽度约 2 米,而普通道路宽度在 3.2 到 3.5 米之间,这意味着相邻车道的车辆间距通常能保持在 1 米以上。这种情况下,即便车辆行驶中稍有偏移,一般也不会造成问题。

但到了商用车场景,哪怕是细微的偏移,都可能引发事故。

比如在码头这类空间复杂且狭窄的环境中,由于作业工艺的要求,车辆常常需要贴着障碍物、港机设备、集装箱或其他特殊物体行驶,间距可能仅有十几厘米。这时,如果 16 米长的车身方向出现 1 度偏差,就可能直接发生碰撞。这对车辆的规划、控制、感知和定位技术都提出了极高要求。 

从技术迁移的角度看,L4 级自动驾驶虽有一些通用技术基底,但绝非能轻易套用到所有场景中,我们也因此投入了巨大的精力打造平台化技术方案,实现一套代码兼容港口码头、园区干线、矿山隧道等差异化场景。

就像港口无人车需要与吊机精准对位,矿山无人车要完成装土、排土等作业 —— 这些场景看似相对封闭,实际操作中需要解决的具体问题却纷繁复杂,远非外界想象的那般简单。

很多时候,只有真正深入到特定行业或场景的 “深水区”,才会明白要做到顶尖水平有多难,这其中的复杂度,远比我们最初设想的要高得多。


03 产品研发:200人团队+上汽外挂,破解港口自动驾驶技术的“魔鬼细节”


雷峰网:我看到你们公众号上的的视频演示,有一个吊臂把集装箱放到小车上,然后小车穿梭在人流和有人驾驶车辆的港口中。你们在做这个技术的时候,也会涉及龙门吊上面的算法吗?

江灿森:是的,其实港口场景并非大家想象中那般简单、规整且结构化。

以深圳妈湾港为例,作为一个传统码头,过去全靠人工驾驶车辆运输集装箱,如今我们对其进行了适度的智能化改造,主要体现在两个维度:

一是港机设备智能化,像龙门吊已能实现自动操作,完成集装箱的抓取与装车,这一过程被称为垂直运输;

二是自动驾驶车辆的智能化,车辆在码头内的行驶环节,即水平运输。

前者,车辆需要与龙门吊精准对接,获取任务信息并理解业务需求,随后通过逻辑交互与信息确认,待匹配完成后,才能反馈给相关方任务已完成,以便执行下一项任务。

后者,情况更为复杂,我们的自动驾驶车辆AIV并非在专用道上行驶,而是要与有人驾驶车辆在同一条道路上混合通行,遇到路口时还需与它们进行动态博弈 —— 预测对方意图,判断其是左转还是直行,进而决定是继续前行还是停车避让。

此外,我们设有车端平台和云端平台两个核心部分。

车端平台主要负责单车技术软件层面,涵盖中间件、传感器数据处理及操作系统等;云端平台则聚焦于车队管理。 

在商用车自动驾驶领域,车队管理系统(FMS)是极为关键的环节。乘用车领域中,车辆之间彼此独立,分属不同消费者使用;但商用车自动驾驶中,车辆是运营体系的重要组成部分,必须对整个车队进行系统化管理。

这其中包括精细化的任务管理,比如明确每辆车的任务去向,是去 A 箱区、B 箱区,还是前往充电等,都需要精准的任务委派。

同时,还要对车辆运行效率进行动态管控。例如,当几十辆车即将途经同一条道路时,可调配部分车辆选择其他路线,从而避免拥堵。

这就好比外卖配送,如果缺乏管理,骑手可能会扎堆争抢看似容易的订单,导致部分区域过度拥挤,而其他区域却无人问津。我们需要对车辆进行合理调度,明确它们的作业时间、位置以及避让规则,这些都在云端完成统筹与管理。

所以说,码头场景的复杂性远超想象,它包含了多种混合通行形式,以及与其他交通参与者的高频交互博弈。

雷峰网:你们现在有多少人,友道背后有上汽集团给了哪些支持?

衡量:我们公司现在总共有 200 人左右,自动驾驶中心有 170 人,还有产品工程中心和售运营中心。

产品工程中心负责所有车辆的设计和制造,包括AIV的设计、零部件采购、组装。我们在园区内有一个 AIV 工厂,由产品工程中心负责生产。

他们能够借助上汽集团的资源来完成这些工作。

比如车辆需要的电驱、电控、电池管理系统,因为是电动车,此外还涉及转向、驱动、刹车等整车相关的开发,以及嵌入式开发。这些工作大多是上汽集团商用车技术中心来支持我们的。 

雷峰网:你们现在的运营不只在国内港口,也有南美洲的秘鲁港口,那么将技术方案复制到国内外港口时,你们会做哪些调整?

衡量:集装箱是标准化的,因此全球的集装箱码头也大同小异,这是我们把技术迁移到国外时的有利因素。所以,我们的AIV出国时,算法、作业流程上需要的额外工作很少,和部署到国内的另一个港口差不多。

那么不利因素有哪些呢?我觉得主要是语言和文化,需要把操作手册、软件界面改成外语,例如在秘鲁就得改成西班牙语,以便于当地的运维人员使用。日常和他们地沟通交流也需要用外语,但是我们公司没有通晓西班牙语的同事,幸好有了大模型能方便、准确地来翻译。

说件有趣的事,秘鲁的同事在第一次见到AIV时,都不相信这个大家伙能自己跑起来。等他们看到AIV不但跑起来而且很灵活时,他们雀跃欢呼,他们为自己的这份工作而骄傲。

雷峰网:关于传感器,我想了解一下在港口这样高精度要求的工业场景中,龙门吊交互需要厘米级定位(如3cm精度),同时还要应对人车混行的复杂环境,你们如何平衡传统几何模型(如SLAM)与深度学习各自的优势?

江灿森:在港口或者工业园区的自动驾驶作业中,常会遇到一些极端场景,这对定位精度提出了极高要求。

比如,当自动驾驶车辆需与龙门吊协同作业时,龙门吊需要通过夹具自动抓取集装箱。这个过程中,夹具必须精准对准集装箱四个角的锁孔,这些锁孔的宽度和长度一般在10公分左右。如果夹具下放时不能精准地对准锁孔,就会导致抓箱失败。

因此,我们对定位精度的要求是误差在 5 厘米以内,而我们实际能做到的精度是 3 厘米,这样就能确保夹具精准地夹住集装箱并将其抓起。反之,如果定位精度不足,比如误差达到 20 厘米,那么抓取时夹具很可能无法锁住集装箱,这不仅会导致交互失败,整个自动化作业流程也会中断。

不过需要说明的是,深度学习和我们目前的定位技术并非一个概念。

虽然有些方案试图通过深度学习和神经网络直接输出车辆的定位信息,但这些方案在业界尚未得到广泛应用。目前,行业内仍以传统算法为主,比如 SLAM(Simultaneous Localization and Mapping,即同时定位与建图),其背后的数学原理和理论推导仍沿用传统框架。

深度学习在其中的作用更多体现在前端特征提取环节。例如,过去我们可能通过传统的算法,像 Harris Corner ,通过梯度计算来找出图像中的特征点。现在,我们可以通过深度学习来识别场景中的特征,使特征提取更加鲁棒。但后端的融合算法,比如卡尔曼滤波,以及各种平滑处理等,依然基于传统技术框架。

雷峰网:在港口场景的实际运营中,面对钢轨反光、盐雾腐蚀等特殊环境挑战,友道如何评估不同传感器的可靠性边界?特别是在安全冗余设计方面,是否意味着纯视觉方案在工业场景中存在根本性局限?

江灿森:我们常说坚持纯视觉的方案,核心还是出于商业层面的考量,要把成本压缩到极致。

如果完全不考虑成本,当然是传感器配置越丰富越好,从安全角度来讲,信息冗余总是比信息不足更稳妥。对于商用车场景来说,很多时候需要把十几米长、上百吨的车开到某个位置,偏差不超过几厘米,那么激光雷达优秀的测距能力就很关键,这是摄像头做不到的,因为摄像头无法直接测距,而所有的间接测距方法的误差都很大。

从成本效益来看,一辆商用车一年可以挣 30 万,那么几千元的激光雷达肯定是用得起的,如果还能提升效率的话,用激光雷达就更划算了。随着激光雷达价格的逐步下降,其在商用车场景中的应用性价比还会持续提升,我相信未来激光雷达会成为自动驾驶的标配零部件。


04 商业模式:虚拟司机 + 卖车 + 运力服务,一家 L4 公司的三种活法


雷峰网:那么你们现在的主要客户是谁?

衡量:我们的客户主要是港口(包括集装箱码头和散货码头)、矿山、各种工业园区。

与主流的商用车 L4 公司相比,我们在工业园区方面也有明显的竞争优势,比如沙钢、六钢和宝钢等钢铁厂内的运输业务,我们都有涉足,且运营的车队规模也比较大。

雷峰网:针对港口这块的商业化,你们同时在做新码头建设和老码头改造,各自进程如何,有哪些案例?

衡量:秘鲁钱凯港可以作为新码头的典型案例。

这个码头是完全新建的,位于南美大陆西海岸,是目前南美最大的集装箱码头之一,由中远海运运营。之前只是一片海岸突出的空地,从修路开始,完全新建了一个码头。知名度也比较高,是中国“一带一路”战略出海的典型案例。

港内运输的车辆全是我们的 AIV ,去年已经有 40 辆车运行,效果非常好,运量还需要进一步提升,所以今年又增订了 10 辆车。

老码头智能化改造的案例有很多。

比如上海的外四码头和深圳的妈湾码头,这些码头都是已经成熟运营了很多年的集装箱码头,里面都有上百辆人工驾驶的车辆。我们的车辆逐渐进入这些码头,从 10 辆、20 辆到 30 辆、40 辆,数量不断增加,作业能力从承包半条船成长到承包数条船。

目前,所有运营场景都是盈利的,而且我们的盈利计算方法很苛刻,车辆的折旧、运营费用等所有成本都算在内。

当下有 400多 辆车在运行,今年的运营收入预计近两亿元。从公司整体来看,要实现盈利,现有车队规模还需要再增加两倍。

雷峰网:这意味着,你们不仅是研发型公司,也是运营型公司一一从头到尾完成整个项目。

衡量:对,这涉及到商业模式的问题。

L4 与 L2+ 有很大区别。L4 车辆可以自己跑起来,这种情况下商业模式就变得多样化。

我们有三种商业模式:

第一种是售卖车辆。客户直接购买我们的车或第三方的车,车上装好我们的智驾系统。我们会提供车队管理系统,教会客户使用。

第二种是“虚拟司机”。客户持有车辆,客户只需支付车辆本身的费用,与普通车辆价格一样。智驾系统软硬件的费用则由我们承担,车辆在客户场景中无人运行后,我们按照人类司机的价格向客户收取“司机工资”,相当于我们出售的是“虚拟司机”。

第三种是提供运力服务。这种模式常见于集装箱码头,因为码头公司通常不拥有自己的内集卡车队,而是将运力服务外包。我们也是按照箱量收费,客户付钱给我们,我们运营车队,车辆由我们持有。这种模式资产非常重,我们需要通过融资租赁等方式来缓解现金流压力。

这三种模式友道都有,但我们更倾向于前两种模式。不过,有些客户坚持要第三种模式,我们也能满足他们的需求。

雷峰网:涉及赚钱就会有更细节的设计,比如小车能拉多少货、长宽高,也是你们来做吗?

衡量:车辆的载货量、尺寸等细节设计,需要根据客户需求来定。一般来说,我们会和客户讨论他们的运输业务需求,确定需要什么样的车型。比如集装箱运输比较标准化,因为集装箱尺寸固定,所以我们的AIV可以适配几乎所有的集装箱。

但在散货码头和矿山,情况就不一样了。有些散货码头要求车辆载重 105 吨,因为他们的吊机 1 次能抓取 35 吨,3 下正好 105 吨。如果用 90 吨的车,操作起来就不高效。

这些需求都是由客户场景中的其他机械带来的约束,导致我们的车型比较碎片化。这就对我们的智驾系统提出了重大考验,需要适配各种不同的车型和场景,同时尽可能降低适配工作量。

目前我们落地的场景近 20个,其中一半是集装箱码头,另一半是散货码头、工业园区和矿区。非集装箱码头的场景中,几乎每个场景都需要一种不同的车型,所以有近 10 种不同的车型。


05 管理哲学:从硅谷到港口,技术管理者的认知迭代


雷峰网:友道现在有多少人,这四年人员数量是怎么变化的?

衡量:友道曾经有 330 人的智驾研发团队,之所以现在减少到 170 人,是因为保证研发的人效比。

330 人的时候,我们处于自动驾驶能力快速创建的时期,做了非常多的从0到1的研发工作。现在已经有了四五百辆车稳定运行,后续从1到100的研发不需要那么多人员,所以从 2024 年年初开始,我们一直持续优化提升研发人效比。

雷峰网:你底下的“减一”有几个人?

衡量:在团队规模为 330 人时,减一层级有 9 个人,分为 9 个部门。

后来团队规模缩减到 170 人时,一些部门被合并,减一层级减少到 5 个人(产品与质量、感知、导航、车端平台、云端平台)。

例如,之前地图、定位是一个部门,规划、控制是 另一个部门,现在合并为一个导航部门;同时,人员的角色也有所调整,比如之前做定位的现在可能转岗做规划。

雷峰网:是不是可以理解为,技术研发阶段快要结束了,接下来要重点推进落地和市场占有率了?

江灿森:可以这样理解。

我们早期加入友道的时候,很多技术方案的迭代都是基于 demo 性质的技术架构。很多算法的 baseline 都是从供应商那里获取的,这是车企比较常见的做法一一找一些研发团队或高校合作,提供研发经费,让他们交付功能,过程中还需要反复沟通调整。

不过,做 demo 的时候,运气好效果还不错,运气不好就会频繁出错、稳定性差。这对于实际运营来说是完全不可接受的。因为运营是 24 小时不间断的,停 10 分钟都算生产事故,没有容错空间,不能动不动就出问题再让人去紧急救火。

我刚加入友道时,就意识到这个问题,于是快速扩张团队,从 0 到 1 搭建了诸多算法原型,把之前那些不够完善、靠打补丁维持、仅针对特定场景开发的算法进行了优化。

二是我们需要对算法进行重构。

必须从原理和泛化的角度去思考:一个算法在某个场景能用,在其他场景是否同样适用?只要是一个有共性需求的功能,就得兼顾不同场景的需求。否则,只针对单一场景开发,即便在该场景下表现很好,一旦换个场景,代码可能就失效了,到时候就得重新开发,这是严重的资源浪费。

三是技术独立性与全栈掌握。

上汽旗下有中海庭(高精度地图图商),我们沿用了他们不少地图技术基础,所以省去了早期的研发投入。但我们希望能全栈掌握这些技术,以防在我们业务快速拓展,尤其是定制化业务需求急剧增加时,即使是兄弟公司也难以满足突发业务需求的快速响应。这个环节必须补上,否则越到后面,整个架构会越受限。

22年到23年,是我们快速补充技术基础的阶段,团队扩张速度很快,技术研发迭代也非常迅猛。比如地图定位团队,我加入的时候只有六七个人,到最高峰时接近 40 人。

2024 年开始,我们的技术逐渐成熟,人员出现了冗余。原来可能需要好几个人开发一个算法,后来随着技术成熟,人力需求自然减少。

雷峰网:你现在是公司的首席科学家、智驾中心总经理、公司的副总经理,属于技术和管理都要管,你还适应这种转变吗?

衡量:技术人员的发展路径通常有两种:

一种是继续深入钻研技术,成为某一领域的专家,甚至进入学术界成为教授或高级研究员;另一种则是转向技术管理。我的个人发展路径是后者。

创业时,在 Roadstar.ai 管理 100 多人的研发团队,到大疆管理最多 30 人的研发团队,再到友道管理峰值300 人的研发团队,其实每一阶段的感受都很不一样。

最开始在学校和刚进谷歌时,我专注在把自己负责的一个模块做好,例如写好一篇论文,或者写下一段无法再优化的代码——精炼、优雅,带着数学般的美感是我那时所追求的。

从特斯拉开始,我开始带领一个小组负责一个较大的系统,那时我专注在把这个系统设计好、实现好,这不仅包括我自己要做好系统的架构设计,也包括教会团队成员写好代码,能搭出一个最优的系统。

在友道我带领更大的团队,我最关注的是能够领导、组织和激励好一个研发团队,这个团队能把一个庞大而复杂的系统做好,做到业界领先水平,这个团队本身才是我最得意的作品。

雷峰网:与其他企业上千人的智驾研发团队相比,友道现在的 170 人团队已经非常精干了;从你过去经历来看,管理过 30人、100 人、330 人,这又是一个数量级的翻番。我很想知道,现在如何发挥这 170 个人的最大能力?在这方面,你最近有什么心得体会吗?

衡量:管理团队的方式会随着团队规模的变化而变化。

对于 30 人以下的团队,作为管理者可以清楚地了解每个人的工作内容,甚至可以手把手指导每个人的工作。但当团队人数超过 30 人后,就需要一套组织架构和管理机制来支撑。

我在Roadstar时切身体会到当公司从 30 人增加到 100 人时,人数增加了 3 倍,但工作效率并没有增加 3 倍,可能只增加了 50%,甚至可能连 50% 都不到。

这让我开始反思管理方式的重要性。尽管我之前作为工程师时,对组织学相关的东西有些反感,比如公司文化、团建、组织架构、汇报机制、会议机制和项目跟进机制等,但当我真正成为较大组织的负责人时,才发现这些机制是必要的。

从那时起,我一直在思考如何管理一个组织。

我早期的工作经历主要是在硅谷,比如谷歌的街景和特斯拉的 Autopilot 团队,那里的组织形式比较宽松,完全依靠员工的自驱力。

但在 Roadstar 时我发现,仅靠自驱力是不够的,并不是所有人都像硅谷的精英那样有很强的能力和自驱力。

后来我去了大疆,其中一个原因是想看看这种严格管理的公司(比如上下班打卡、每天早会晚会)到底有什么优点和缺点。在大疆的经历对我来说是一个综合学习和提升的过程,我领悟到管理方式与团队中的人才结构和状态密切相关。

就像孔子说的“因材施教”,管理也是类似的。

在友道,总体来说管理风格已经比较成熟,实践下来也没有什么大问题。

雷峰网:怎么说?

衡量:不管是团队人数最多的时候有 330 人,还是现在有 170 人,我们基本上都是按照模块对技术人员进行划分。

比如感知、规划等团队,这属于研发资源线。每个部门最重要的任务是完成对应的研发任务,培养员工的技术能力。

在产品方面,我们有这么多车型和场景,我会拉出一个纵向的产品矩阵一一每个场景都有对应的项目经理,他们会从感知、规划、控制等模块各抽调一个模块代表,由产品经理带着模块代表负责每个项目的交付。

每个项目的模块代表会把项目对自己模块的要求带回自己部门,部门负责人会定期(每周一次或两次)和所有模块代表开会,搞清楚各个项目对我们的研发要求是什么,下一步需要我们做什么事情,并把这些要求合并同类项。

通过这种“矩阵式”的研发结构,我们能够根据各个项目的紧急情况、优先级和研发计划,确保按期交付项目需求。这种结构使得几百人共同编写一套代码,同时支持多种车型和场景成为可能。

随着技术管理经验的积累,我越来越意识到经济学头脑和成本意识的重要性。

对于研发来说,最重要的成本是人力成本,研发人员的工资普遍较高。因此,我的目标是用尽可能低的人力成本来完成尽可能多的项目和产品交付要求。换句话说,做到成本高效(cost-efficient),是衡量我作为研发团队管理者角色是否成功的关键。

雷峰网:这挺有趣的,组织架构的调整随着公司的发展阶段(如之前提到的三个阶段)而变化,同时也考虑到了员工的职业规划,我感觉到,友道对于你们来说都是职业生涯一个重要里程碑,从仰望星空,到脚踏实地。

衡量:在硅谷创业的时候,大家其实不太关心这些细节,因为大多数创业的目标就是等待某个大公司来收购。

大家的做法是先烧钱,甭管赚不赚钱,先搞个几十辆车的车队,招三四百人,想让投资人一看,“哇,我这个公司有规模,有气势,赶紧来投我吧。”

回想之前在 Roadstar 创业时的教训,当时总体目标不清晰,烧钱很厉害,虽然融资也很顺利,但没有明确的目标:

是把 demo 做好,把下一轮投资人能够哄进来就行了?还是把技术打磨好,要做到最 cost efficient 的方式,让技术能赚钱?这种目标不统一导致了创始人、投资人之间的矛盾。

现在我们要考虑,“做这件事要付出多少成本,能挣多少钱,如何让利润不断增长。”同时,技术研发也要有财务目标来指引,决定该做什么、不该做什么。

友道的目标很明确:上市是一方面,但更重要的是我们目前的场景和技术已经很好,我们有能力自己养活自己并实现盈利。

当我们明确了这个目标,所有的事情都变得清晰起来。因此到了算账的时候,是很容易算清楚的。数字虽然冷冰冰,但很客观,它指引着整个公司的方向。我们的目标是把盈利数字做好,不管是技术研发还是其他目标,都要围绕这个核心。

现在我看到不少自动驾驶公司或团队也在朝着这个方向转变,比如 bot.auto 的侯晓迪也强调运营的重要性,以及如何实现盈利。

雷峰网:说到侯晓迪,你们倒是有一些经历上的相似之处,你们认识吗?

衡量:我们认识,在拉斯维加斯见过面,但没有特别深入的交往,只是神交。可能是因为我和他有相似的经历,现在做着类似的事情,他的一些观点我都很认可——例如,L4自动驾驶真正应用的难点不在于解决少量的大问题,而是要解决大量的小问题。

雷峰网:有没有一些伙伴跟着你来到友道,他们会怎么评价你的管理风格变化?

衡量:你可以问灿森,他从大疆开始就和我共事了。

在 Roadstar 时期,我做事也比较急,因为当时团队规模小,从十几个人到三十个人,我能管到每个人。我们出来创业比Pony、景驰晚一些,急着让车上路,带着大家一起加班。甚至有同事从东部州搬过来,我家有空房,他就住在我家,我一大早就叫他起床一起去上班,忙到晚上十一二点再一起回来。

现在回想起来,那时候对同事确实有点“压榨”,但那是创业的状态。

江灿森: 我第一份正式工作在大疆,在那里我认识了两个特别敬佩的领导,一个是张宏辉老师(曾任大疆感知系统部门负责人),一个是衡博。

他们有一个共同的特质,就是对学习抱有极强的热情。

张老师格外注重技术的前沿性,我每次去找他,总能看到他在研读论文。就是说他不仅重视工程实践经验,还会持续追踪行业内的新解决方案和技术进展,时刻保持对新知识的学习。衡博也如此,我每次与他交流,都能感受到类似张老师的特质,即便他们在能力和技术上都是行业顶尖的,依然保持着谦逊的学习心态,我很佩服。

还有一点,衡博带领的团队有一种很好的氛围一一大家都没有“历史负担”。

比如他刚加入大疆时候,看到我们早期在高精地图方面的工作,无论是从定位还是从建图层面,都还比较基础,缺乏真正深入的思考。而他之前在百度和 Roadstar 的时候就主导过地图模块的开发,对如何定义地图、如何让高精地图更适合 L4 级自动驾驶车辆有着深刻理解。于是我们果断选择推倒重来。

也就是说,只要某个方向、某个技术更优,我们就会积极引进,哪怕要从 0 开始推翻既有成果,也绝不会因为某个技术是自己辛苦钻研很久就舍不得抛弃。我们始终保持开放的心态,就事论事,以最合理的方式做事,只要是对的,我们就坚决去学习、去应用。所以当时候我们整体的技术氛围非常好,研发节奏也很快,基本上每半年就会有一个阶段性的突破。

现在在友道,我也感受到了同样的氛围,就像刚才提到的人员调整、心态转变,我们都可以快速适应调整,并且很快能看到正向反馈。

雷峰网:友道现在有 996 吗?

衡量:我们没有 996 ,大概是 985 。

公司从诞生之初就在商务、政府关系等方面做好了铺垫,很多客户资源已经在股东层面做好了安排,我负责把技术做好。因此,我不需要把员工压榨到极限,而是可以用正常的节奏推进公司发展。

这说明在创业初期,就需要想好这些问题,做好选择。

雷峰网:友道的创立时间是 2021 年 8 月,衡博和灿森是先后加入友道的,可以说你们个人和友道是几乎同步向前的,感悟可能比别人更深刻。现在正好在你们的入职四周年,你们最深的感受体会是什么?

衡量:如果说八年前是骑着一头猪顺着风口飞起来,虽然星光闪耀被媒体关注,但内心实则惶恐不知道方向在哪里,那么最近这四年更像是坐高铁穿越一条长隧道——沿着既定的方向稳步向前,内心充实而宁静,不知不觉中已经跑得很快了,而且光明就在眼前。

现在友道已经比较成型,处于一个良好的发展节奏和势头。我希望接下来能保持现有的节奏和势头,继续拓展新的场景,扩大车队规模,真正实现L4自动驾驶在商用场景大规模落地。

江灿森: 我比衡博加入友道要晚一些,还不到四周年。我个人感触很深的一点是,在大疆的时候,尤其是在2019 年上半年之前,我们都觉得技术就是一切,甚至有些高傲,总觉得我们的技术这么出色,主机厂怎么会拒绝我们呢?

但后来真正和主机厂对接时,才被拉回现实,必须把姿态放低,才有合作的可能。这彻底改变了我们以前的甲方思维,完全转向了乙方思维。

我们也由此意识到场景和主机厂背景的重要性。在自动驾驶领域,门槛远比我们想象的高,绝不是有了软件技术就万事大吉。

这也是我为什么认同友道模式的原因。

友道的股东方本身就拥有大量业务场景,这对技术成长是极大的支撑。因为技术总有不成熟的阶段,这个过程需要很高的技术磨合成本。你得有试错和成长的机会,才能慢慢打磨好。

就像我们现在在港口做自动驾驶,已经有了非常好的 baseline ,以后只要有某个港口想做智能化改造,我们就能快速切入,把业务做起来。

衡博在友道主导了研发中心,我们既能从技术角度深耕,又能兼顾落地。我们早已脱离了最初只做演示、探索新技术的阶段,而是踏踏实实地把技术应用到商业场景中,创造价值。这个转变过程也是对我们心态的历练,让我们真正找到一个方向,真正产生价值,否则技术永远只是空中楼阁。

本文作者吴彤,关注智驾背后的人和事,欢迎道友认识一下,微信号: lI__O0o

雷峰网原创文章,未经授权禁止转载。详情见 转载须知 。

随意打赏

提交建议
微信扫一扫,分享给好友吧。