GPT能为自动驾驶带来什么？

2023年，生成式大模型ChatGPT的出现给沉寂许久的AI市场添了一把猛烈的火，业界甚至有人将其比喻成“AI的iPhone时刻”。

从ChatGPT诞生起，业内就在探讨它将如何与智能驾驶相结合，近日，毫末将这种设想变成了落地的产品。

(资料图片仅供参考)

4月11日，毫末智行在北京举办了第八届毫末AIDAY，发布了自动驾驶生成式大模型产品DriveGPT。

图片来源：毫末智行

DriveGPT如何改变自动驾驶？

自动驾驶行业发展到现在，面临的一个非常大的技术问题在于Corner case（长尾难题）。

从技术的角度看，以往自动驾驶系统认知环境主要靠人工手写规则，但自然界中的场景无穷无尽，相应的规则也没有穷尽，自动驾驶技术的发展非常受限。

为解决这个问题，业内一直在用机器学习替代传统的规则式部分，力求实现端到端的自动驾驶：输入感知数据——机器学习输出规划决策数据。

毫末认为，生成式大模型GPT可以帮助解决认知决策问题，最终实现端到端的自动驾驶。

什么是GPT？

GPT的定义是生成式预训练Transformer大模型，用语言学的逻辑理解，输入一个词，GPT会根据现实中的分布推测下一个该出现的单词是什么，每生成完一个，会把过去的东西加上，当做新的输入猜测下一个是什么，这种生成式模型就可以生成对话。

以中文自然语言为例，单字或单词就是Token，把Token输入到模型，输出就是下一个字词的概率。

而DriveGPT实际上指的是自动驾驶界的生成式预训练大模型，将场景Token化，毫末将其称之为Drive Languag。

Drive Language将驾驶空间进行离散化处理，每一个Token都是场景的一小部分。目前毫末拥有50万个左右的Token词表空间。如果输入一连串过去已经发生的场景Token序列，模型就可以根据历史，生成未来所有可能的场景。

具体解释，只要输入目前的驾驶环境，包括车辆本身的状态、周围障碍物的状态、道路环境等，DriveGPT就会生成未来可能发生的一系列交通状态，就像多个平行宇宙，并根据每一种状态做出不同的决策：前面车辆变道时需要怎么做，不变道时需要怎么做。并且，这种决策会形成完整的证据链。

图片来源：毫末智行

概括来说，毫末认为，DriveGPT雪湖·海若三个能力：

1.可以按概率生成很多个场景序列，每个场景都是一个全局的场景，每个场景序列都是未来有可能发生的一种实际情况。

2.在所有场景序列都产生的情况下，能把场景中最关注的自车行为轨迹量化出来，也就是生成场景的同时，便会产生自车未来的轨迹信息。

3.有了这段轨迹之后，DriveGPT雪湖·海若还能在生成场景序列、轨迹的同时，输出整个决策逻辑链。

在模型优化方面，DriveGPT雪湖·海若主要是通过引入真实人驾接管数据建立RLHF（人类反馈强化学习）技术，对自动驾驶认知决策模型进行持续优化。

此外，还具有场景识别的能力，在毫末智行演示的场景中，普通的解决方案标注一张图片需要大约5远，DriveGPT雪湖·海若只需要0.5元，这个能力将会向行业伙伴开放。

图片来源：毫末智行

另外一点，由于DriveGPT的决策具有完整的逻辑推理链，它也可以提升人机共驾的体验。通过DriveGPT技术，未来人机交互界面（HMI）可以告诉驾驶者，它为什么做出这样的决策，在某种程度上它可以提升用户对自动驾驶系统的信任感。

毫末智行技术副总裁艾锐表示，目前毫末还没有做这样的系统，但理论上看，HMI可以通过语音的方式与驾驶者交流。“我可以把它理解为一个导航意图，你想选一个更快的路还是选一个收费更少的路。从这个角度来说，我觉得DriveGPT后面的想像空间很大。它能实时接收人的反馈之后，也许在大家使用自动驾驶的时候，就不是默默地坐在那里看着了，会有一个更深度的交互。”艾锐说。

毫末如何实现DriveGPT

大模型训练并不是一个简单的事情，毫末也解释了DriveGPT背后需要的能力。

最基础的当然是算力，模型参数规模达到 1200 亿，需要非常强大的算力支持。今年1月，毫末和火山引擎共同发布了其自建智算中心，毫末雪湖·绿洲MANA OASIS。OASIS的算力高达67亿亿次/秒，存储带宽2T/秒，通信带宽达到800G/秒。

还需要训练和推理框架的支持。因此，毫末也做了以下三方面的升级。

1.训练稳定性的保障和升级。

毫末在大模型训练框架的基础上，与火山引擎共同建立了全套训练保障框架，通过训练保障框架，毫末实现了异常任务分钟级捕获和恢复能力，可以保证千卡任务连续训练数月没有任何非正常中断。

2.弹性调度资源的升级。

由于每天不同时段回传的数据量差异巨大，需要训练平台具备弹性调度能力，自适应数据规模大小。毫末将增量学习技术推广到大模型训练，构建了一个大模型持续学习系统，研发了任务级弹性伸缩调度器，分钟级调度资源，集群计算资源利用率达到95%。

3.吞吐效率的升级。

在传统的训练框架中，算子流程很长，毫末通过引入火山引擎提供的Lego算之库实现算子融合，使端到端吞吐提升84%。

此外，还有一个基础能力就是数据，毕竟DriveGPT雪湖·海若需要引入真实的人驾接管数据来优化模型。

在数据来源方面，毫末公布了智能驾驶产品最新的进展：

截止目前，毫末智能辅助驾驶用户行驶里程已经突破4000万公里。毫末城市NOH在北京、保定、上海等城市开启泛化测试，落地即可体验到毫末的城市NOH功能。

首款搭载HPilot3.0系统的新摩卡车型也即将在近期重磅上市，第二款搭载毫末HPilot3.0系统的车型魏牌蓝山也将在今年年内上市。

同时，乘用车高级别辅助驾驶领域，毫末智行已获得三家主机厂定点合同，相关项目已经在交付中。

不依赖雷达，MANA视觉感知升级

除DriveGPT外，毫末此次还重点介绍了MANA在视觉感知上的进展。

此前，毫末的感知视觉自监督大模型是互监督，用激光雷达作为监督信号训练视觉，目前已经升级到纯视觉。

视觉感知的核心目的是恢复真实世界的动静态信息和纹理分布，因此毫末对视觉自监督大模型做了一次架构升级，将预测环境的三维结构，速度场和纹理分布融合到一个训练目标里面，使其能从容应对各种具体任务。目前毫末视觉自监督大模型的数据集超过400万Clips，感知性能提升20%。

此外，毫末还将鱼眼相机引入视觉BEV的感知框架当中，在泊车场景可做到在15米范围内达测量精度30cm，2米内精度高于10cm。

拥有这些能力之后，毫末开始尝试去掉超声波雷达，在纯视觉三维重建方面，通过视觉自监督大模型技术，毫末不依赖激光雷达，就能将收集的大量量产回传视频转化为可用于BEV模型训练的带3D标注的真值数据。

通过对NeRF的升级，毫末表示可以做到重建误差小于10cm，并且对于场景中的动态物体也能做到很好的重建和渲染，达到肉眼基本看不出差异的程度。

由于单趟重建有时会受到遮挡的影响，毫末也尝试了多趟重建的方式。即多辆车在不同时间经过同一地方，可以将数据合在一起做多趟重建。目前毫末已经实现了更高的场景还原度，重建效率提升5倍，同时，还可在重建之后编辑场景合成难以收集的Corner Case。

图片来源：毫末智行

结语：

从毫末的布局中，我们也可以窥见自动驾驶行业的一动向。

首先，汽车行业价格战的影响已经传导至上游智驾供应链领域，“降本”成为重中之重，毫末在AIDAY中表示，要用1/3的成本做同等功能的方案。

在降本的压力之下，高精地图，甚至激光雷达这种高价格的产品都在逐渐被抛弃。在辅助驾驶领域，玩家都在向特斯拉看齐，走轻地图和纯视觉的道路。

另外，除感知之外，行业还越来越重视决策规划。感知尚可以用硬件堆砌，做决策规划则是综合能力的硬比拼，包括算力等基础设施、真实的道路数据和数据处理能力、算法模型等等。总之，辅助驾驶领域的竞争，已经越来越残酷了。

GPT能为自动驾驶带来什么？

沈阳这些公交车进行拍卖了

喝咖啡不仅能减肥，还能降低死亡风险？但很多人都没喝对……

银龙岛地图位置_银龙岛地图

指纹识别板块4月12日涨1.64%，沃格光电领涨，主力资金净流入4.09亿元

环球新动态：403秒！中国“人造太阳”获重大突破

东森游戏换了另外一部switch为什么没有铲子了_东森游戏-环球新消息

周四 ——开创本周新高！（130423）

状元论币：5月6日行情分析 BTC冲高关键时期,谨防回落

成都学龄前儿童如何办理居住证?

英语常用谚语名言精选_关于英语常用谚语名言精选的简介

播报：命运方舟下载慢/无法下载/下载失败/下载不了解决办法

全球新消息丨第五届中国（广东）国际印刷技术展开幕 擦亮“印在东莞”城市名片

焦点讯息：伸舌头、嘴亲肿、面条吻，这些中老年演员拍吻戏，看得人如鲠在喉

每日速读!银行法律部门要走好“三步棋”

焦点速读：神州数码4月12日盘中涨幅达5%

短讯！广西贺州一库房起火：火灾已被扑灭，未造成人员伤亡

「团结奋斗开新局 喜迎工会十八大·扎实推进“县级工会加强年”专项工作」“1年+3年”持续发力建强县级工会 视点

【环球新要闻】大疆8K航拍无人机明天发 悟3真机亮相：个头感受下

加贰佰｜油耗比肩比亚迪DM-i 理想L8真实馈电油耗实测 天天聚看点

落华回忆录_关于落华回忆录的简介|环球微头条

全球快讯:顶点软件(603383)：2022年营业收入6.25亿元，与上期同比增加24.19%

多力橄榄葵花油新年2013年广告_多力橄榄葵花油 世界观速讯

华菱精工：2022年年度业绩说明会定于2023年4月21日举行

天天新消息丨2023天津五一劳动节限号吗？

天天讯息：为港青内地应聘“修桥筑路”

中国新能源汽车鄂尔多斯挑战赛将举行|天天快播

每日观点：公明党员志愿者争当创文先锋，优化社区人居环境

为期四个月！江西正在严查

满减优惠、购房99折！禅城家居消费嘉年华乐购等你来

泰康好效保百万医疗险(甲癌版)有什么优势?多少钱?-当前热点

每日快报!什么看图软件能看psd缩略图_什么看图软件能看cdr

焦欣雨斩获CCTV《星光大道》周冠军，用歌声为家乡宝鸡增光添彩-全球速看料

森林之旅地板旗舰店_森林之旅实木地板|焦点观察

焦点讯息：这·莫比乌斯｜西安最大规模青年艺术节，五一即将开启！

对话博柏利中国区总裁张允馨：持续加码在华市场

今日聚焦!鹿晗演过的电视剧多吗_鹿晗演过的电视剧

主销车型63万元 高合HiPhi Z交付量超1,000台

天赐材料(002709.SZ)2022年净利增长158.77%至57.14亿元，锂离子电池材料业务高速增长，拟10股派6元|每日关注

酒企预热糖酒会 光瓶酒或成关注热点|当前快讯

国际象棋分区赛第六轮：女子领先集团空前壮大|前沿热点

天铁股份：控股子公司中标铺轨扣件材料采购项目-全球热议

马内迎来31岁生日，拜仁今日训练前为其庆生 全球时快讯

95后首席焊工：用技术突围无数奖牌 全球热推荐

财报前瞻 | 银行业危机对花旗(C.US)有何影响？周五揭晓答案 世界播报

【全球新视野】1038家公司推出派现方案 21家上市公司派现超百亿

【全球独家】1746-OA16**瑞士ABB

【全球播资讯】当文艺韵流淌在烟火气中——“新声兰州·城市文化市集”速写

可敬的志愿服务精神-全球快报

洛阳：唱响新时代“牡丹之歌” 环球快播报

三六零宣布「360 智脑」率先落地搜索场景 面向企业用户开放内测

焦点滚动:400多家企业揽才 春季大型现场招聘会走进校园

解局 | 评级信用预期外的首创城发_今日关注

用心去感受一个人的真心_用心去感受

大族数控2022年净利4.35亿同比下滑37.8% 董事长杨朝辉薪酬204.69万

发力电连接、智能电工照明两大赛道 公牛集团2022年度营收同比增长13.70% 天天最新

百隆东方(601339.SH)2022年净利润15.95亿元，同比增长16.36% 每日速递

每日快看：青岛港最新公告：一季度合计完成货物吞吐量1.61亿吨 同比增长9.6%

天天时讯：金融“春雨”润泽春耕春种 激活农业发展“春水”

世界焦点！好评中国丨中国式现代化是实现民族复兴的必由之路

​杭州师范大学招聘体育老师，要求奥运冠军、世界冠军？学校回应

全球快报:杜兰特常规赛数据：出战47场+180俱乐部 场均29.1分6.7板5.0助

人民币暴跌下怎么保护你的钱袋子？

世界滚动:前列腺增生的症状有哪些表现_要生了有哪些表现

午托班怎么招生最有效|当前热文

速读：复赛至今 乔治的发挥非常稳定 他已连续5场至少得到20分

老人雨夜走失急哭女儿，宝山民警暖心帮助化危为安-全球最资讯

勃鲁盖尔家族“来到”北京：那些村庄、农人和静物-天天消息

机票提前多久可以办理登机牌_机票提前多久可以退票

资讯推荐:启辰大V DD-i将于上半年上市，这个外观有多少人会很喜欢？

天天快资讯：炸裂阿库尼亚中场抢断后轰超级世界波&比赛最后时刻被罚下

河南嵩山龙门足球俱乐部更名为河南足球俱乐部-焦点

海油发展：4月7日融资净买入1038.7万元，连续3日累计净买入4375.09万元

聚焦世界卫生日：中国推动优质医疗资源下沉，增进群众就医获得感-全球微资讯

4月7日基金净值：天弘安康颐享12个月持有A最新净值1.0116，涨0.32% 最新快讯

中钢国际：一季度净利预增43.71%–78.66%_百事通

快消息！小米新专利：屏幕可向后翻折 一颗镜头两用

江西开展山茶油专项整治 严打生产经营违法违规行为_世界微动态

MSCC-160-A2电机软起动器的作用

老父亲70大寿送啥礼物好

全球新消息丨第五届中国（广东）国际印刷技术展开幕擦亮“印在东莞”城市名片

「团结奋斗开新局喜迎工会十八大·扎实推进“县级工会加强年”专项工作」“1年+3年”持续发力建强县级工会视点

【环球新要闻】大疆8K航拍无人机明天发悟3真机亮相：个头感受下

加贰佰｜油耗比肩比亚迪DM-i 理想L8真实馈电油耗实测天天聚看点

多力橄榄葵花油新年2013年广告_多力橄榄葵花油世界观速讯

主销车型63万元高合HiPhi Z交付量超1,000台

酒企预热糖酒会光瓶酒或成关注热点|当前快讯

马内迎来31岁生日，拜仁今日训练前为其庆生全球时快讯

95后首席焊工：用技术突围无数奖牌全球热推荐

财报前瞻 | 银行业危机对花旗(C.US)有何影响？周五揭晓答案世界播报

三六零宣布「360 智脑」率先落地搜索场景面向企业用户开放内测

焦点滚动:400多家企业揽才春季大型现场招聘会走进校园

发力电连接、智能电工照明两大赛道公牛集团2022年度营收同比增长13.70% 天天最新

每日快看：青岛港最新公告：一季度合计完成货物吞吐量1.61亿吨同比增长9.6%

天天时讯：金融“春雨”润泽春耕春种激活农业发展“春水”

杭州师范大学招聘体育老师，要求奥运冠军、世界冠军？学校回应

全球快报:杜兰特常规赛数据：出战47场+180俱乐部场均29.1分6.7板5.0助

速读：复赛至今乔治的发挥非常稳定他已连续5场至少得到20分

快消息！小米新专利：屏幕可向后翻折一颗镜头两用

江西开展山茶油专项整治严打生产经营违法违规行为_世界微动态

环球微速讯：青年壮志航空报国《专精特新研究院》走进无人直升机行业领跑者

当前聚焦：信用卡个性化分期怎么办理？信用卡分期还款跟最低还款哪个好？

福建省县级融媒体总平台与新福建客户端实现互联互通全球信息

时间管理局电影资源（时间管理局电影）环球热文

广汇能源业绩快报：2022年净利润113.38亿元同比增126.61%

港股异动 | 优然牧业(09858)涨超8% 机构指公司今年增长有望回归稳健动态估值具备上升空间-每日讯息

今日7股公布年报翔丰华净利润增幅最大-天天关注

周鸿祎离婚超6%公司股份转给前妻具体情况如何呢？

一年一清明一岁一追思

全球热点评！宝宝游泳一次游多长时间最长不超过10分钟,过长疲劳至虚脱

丽江消防｜广泛开展“缅怀革命先烈、凝聚奋进力量”主题党日活动观热点

越野疯狂赛车官网在哪下载最新官方下载安装地址_环球热门

湖北加强科技激励九条措施：最高奖补500万元，精准聚焦三类科研人员全球快消息

天天信息:最后一次股东大会在即瑞信将如何直面愤怒的股东？

宁乡税务：税企共建添动能携手并进促发展|独家

麦格纳吴珍：汽车产业链应积极跟上主机厂升级换代当前关注

红原县气象台发布雷电黄色预警信号【III级/较重】播报

环球微头条丨大名城定增6亿股申请收问询函要求说明5个募投项目资金的具体构成