[汽车之家 行业] 10月21日~24日,第三十二届中国汽车工程学会年会暨展览会(SAECCE 2025)在中国重庆·科学会堂召开。SAECCE 2025通过汇聚行业智慧、展示前沿技术、搭建合作桥梁,并携手全球汽车科技力量,服务全球汽车科技发展,共创世界级汽车科技创新平台。
在SAECCE 2025于10月23日下午召开的“人工智能主论坛”上,百度智能云汽车业务部副总经理肖猛以《云智一体:构筑智能汽车的创新底座》为主题进行了演讲。

肖猛表示,VLA对算力的需求会更大,一方面在训练上有更大的算力要求,比如需要多模态的融合,同时多阶段的训练,同时VLA末尾有一段强化学习的过程,需要非常大的算力支撑它。推理端需要更多算力支持它的推理,包括数据处理、训练场景的合成、仿真测试都需要更多的算力,这些算力也是近一两年整个智能驾驶在市场上算力规模爆发式增长的原因。
以下为演讲实录(汽车之家精编):
大家下午好!
很高兴在这个场合能跟大家分享一下我们的一些现状和一些思考。
目前来讲,云+AI是汽车创新的一个新的动力,不论是智能驾驶也好还是智能座舱也好,是通过大量的算力和新的模型技术提供对应的服务,汽车领域在驾驶、座舱和企业内部提效都有非常重要的应用。
我们先看云平台如何来支撑自动驾驶的研发,百度是主流的云服务商,百度今年在智能驾驶云市场排名第一,整个汽车云市场这几年有非常大的增长。VLA目前已经开始逐步量产了,我们在云平台上面对VLA的支持是非常重要的,之前自动驾驶是从规则的范式慢慢过渡到端到端的范式,今年VLA的范式已经在某些车型上得到了落地的应用。
VLA对算力的需求会更大,一方面在训练上有更大的算力要求,比如需要多模态的融合,同时多阶段的训练,同时VLA末尾有一段强化学习的过程,需要非常大的算力支撑它。推理端需要更多算力支持它的推理,包括数据处理、训练场景的合成、仿真测试都需要更多的算力,这些算力也是近一两年整个智能驾驶在市场上算力规模爆发式增长的原因。
百度的百舸5.0发展了很多,从百舸1.0到5.0不断改进,它能整体提升训练的效率,目前很多头部自动驾驶研发团队在用百度的百舸进行模型开发和加速。百舸5.0也是我们今年发布的,它内置了很多种智能驾驶模型的深度优化,它对端到端的模型包括感知模型都做了很多优化的处理,最大能提升100%的效率。大家都知道GPU卡也很贵,能够提升一部分的效率就是节省了费用。
百度昆仑芯的集群已经做到了万卡的集群,图上看到的东西是32卡和64卡的超大集群规模,对卡间的互联带宽、单机能力和集群推理能力都得到了很大的加强。
同时,百度在VLA支持上我们还有很好数据方面的支持,大伙儿知道数据标注是一个非常大的工作量,我们跟很多团队交流的时候发现他们进度要求都很着急,因为看到友商们都在快速发展,每个团队都希望更好的、更快的拿到优质数据,百度可以用高精度地图做数据反投,基于地图和车辆传感器帮助客户把数据标注做的更快、更好。
LD地图也可以用来做VLA训练的数据来源之一,我们知道LD地图比高级别地图成本低很多,而且鲜度和覆盖度都高了非常多。百度LD地图覆盖全国所有城市,一周左右就有比较好的更新。
它在支持VLA的时候有几点,VLA本身在推理过程中是通过思维链,我们可以通过地图本身提供一部分的增值信息用来加强推理。在训练的时候,VLA后面有一段是来做强化学习的,强化学习通过LD地图的经验图层,这个弯道上没有标限速是多少,但我们能够拿到大部分的车在弯道是什么样的速度,这个值就是人的经验图层,把它做增值就可以引导VLA训练过程中强化学习数据的部分。
同时,VLA开发过程中需要非常多的数据支撑,这些数据通过采集很难达到很完美的程度,我们可以通过数据合成的方式去做支持。
这是场景的重建,采集的场景重建的3D场景,我们把一辆车放进去,放进去之后可以在各个不同环节重新生成它的模型。同样车的视角里面可以生成不同样的素材,这是过水的,刚刚是过夕阳的,这是过雪地的。这样我们可以通过合成的方式创造更多的数据用于VLA的训练,这块也是需要比较大的推理算力来支持。
在开发过程中需要一套更好的工具链,百度数据闭环的工具链从数据采集到模型开发仿真都可以非常好地支撑自动驾驶开发的全过程,来加速模型的迭代,目前也有很多车场的团队在使用百度这样的工具。
前面讲的是云计算在智驾方面的支撑,在智能体和端到端语音方面,百度也有对应的模型和技术来提升座舱的体验。百度提供完整的智能体货架,覆盖出行场景、用车、内容、生活和陪伴各方面的场景。这是智能体对车外的问答,时间关系不去展示很完整了,这是多模态车型的效果。
通过车型向导方面的智能体,还有端到端的语音,我们知道语音交互越来越会偏自然,刚才李骏院士也讲到拟人化,百度从传统语义到大模型增强,2025年我们出来了端到端的语音产品,大伙儿可以的文心一言app体验端到端的语音效果。目前端到端语音也会进入座舱,这里可以检点的对话效果。它非常拟人化,而且延迟非常短,可以大大提升车辆语音交互的效果。
端到端的语音目前融入了座舱的整体架构,我们在云端和端侧一起配合着来支撑,将来你会看到用户在车里的问答,一部分通过端侧模型来支持,一部分通过端到端语音直接给出回复,它的语音效果就会非常地好。
一部分复杂的车控理解再通过智能体的方式去配合,整体来讲是非常综合、多层级的架构在车上,目前我们跟一些典型的车企开始合作,也在今年就会逐步地落地。
乐道L90(参数|询价)接入了百度的服务,深蓝也接入百度座舱层面的服务。大模型助力企业效能提升也是一个非常关键的热点,我跟几乎绝大部分的车厂在这方面有交流,他们非常热衷把大模型的能力在厂内进行落地,包括知识问答、质量管理、业务工作流程,这里我们可以看到大模型在汽车企业在研产供销服各个环节都有非常落地的方向点。一方面需要百度这样的企业提供更好的模型和更好的技术平台,模型开发平台和应用开发平台,也需要企业IT团队开始具备AI落地的能力,同时整个产业生态能够提升AI落地上服务的能力,这样才能更好地帮助整个车企在企业内部提升AI。
百度自己有一整套完整的开发平台,接入了很多车厂的内部系统,从底层的大模型平台到应用侧上面的应用开发平台,已经开始为很多的企业提供对应的服务。
举个例子来讲,代码生成这样的产品可以大大提高效率,百度厂内AI代码生成的比例已经超过了40%,我们已经赋能了1万家企业,采纳率能够达到46%,更多的场景也需要我们的共同努力,能够把AI能力更好地在汽车行业进行落地。
以上是百度的语音+AI如何在智驾、智舱以及企业提效上提供的服务,我们也希望更多的车企能够跟我们一起更好地把服务AI化做得更好。谢谢大家!