您的位置:首页 > 互联网

大模型「上车」关键一步:全球首个语言+自动驾驶全栈开源数据集来了

发布时间:2023-09-04 11:12:48  来源:互联网     背景:

声明:本文来自于微信公众号 机器之心(ID:almosthuman2014),作者:机器之心,授权转载发布。

说到科技圈的近期新闻,没有比小马和小扎约架这件事更热闹的八卦话题了。

前几天,马斯克直播了自己上门寻找扎克伯格的过程。虽然最终无功而返,但小马显然 “醉翁之意不在酒”,而是想借机展示特斯拉最新的 FSD V12自动驾驶功能。

可就在小马得意洋洋的向观众介绍时,自动驾驶系统却出了状况,在一个路口时作出了错误的判断,逼得小马手动干预了驾驶。小马尴尬地表示要 “给网络喂更多的相关数据”。

特斯拉上海工厂最新进展

可见强如特斯拉的 FSD v12,也存在处理复杂场景时决策推理能力不足的问题。这让人不禁想问,有没有什么办法能解决这一难题?

上海人工智能实验室 OpenDriveLab 认为,要解决这一难题,引入时下大热的大模型可能是一个解决方案。

DriveLM | 动机

大模型已经在自然语言处理问题上证明了自己的威力。然而要想让它大显神威,海量数据必不可少。在自动驾驶领域,通过量产车大规模采集数据来支持自动驾驶系统的想法尚停留在建设阶段,各家车厂间的竞争也使得数据集的开源共享变得不切实际。

但如果换一个角度思考,大语言模型中的推理范式和常识在现实世界是通用的。如果能利用起现有的成熟大语言模型和海量语料数据库,再加上CoT(Chain of Thought)、GoT (Graph of Thougtht)等推理 Prompt 技术,站上巨人的肩膀,就可以让自动驾驶系统应对复杂状况的能力更上一层楼。

据此,上海人工智能实验室 OpenDriveLab、德国图宾根大学 Autonomous Vision Group、德国图宾根 AI Center 联合推出了世界首个语言 + 自动驾驶全栈开源数据集——DriveLM,旨在借助大语言模型和海量自然语言数据集,构筑复杂场景下安全、精准、可解释的自动驾驶系统,突破现有自动驾驶推理能力上限。

同时,DriveLM 也是 OpenDriveLab 提出的 DriveAGI 的重要组成部分。OpenDriveLab 之后将围绕 DriveLM 举办一系列语言 + 自动驾驶竞赛,以推动自然语言处理领域和自动驾驶领域的交流与技术交叉进步。

OpenDriveLab 提出的 DriveAGI 总体框架

不过今天,机器之心先带大家一起来看看这个融合语言信息的自动驾驶数据集是如何在大语言模型和自动驾驶系统之间搭建起桥梁,让大语言模型帮助自动驾驶系统获得更强大的、可解释的推理能力的。

Repository:https://github.com/OpenDriveLab/DriveLM

Page:https://opendrivelab.github.io/DriveLM

Hugging Face:https://huggingface.co/datasets/OpenDrive/DriveLM

DriveLM | 特点

  • 结构化推理与思维图评测

苹果折叠iphone要来了尺寸达8英寸

2020年传感器市场规模

DriveLM 提供了量化的推理能力评估标准,改变了模型的结构化推理(Structured-reasoning)或思维图(Graph of Thoughts)能力难以量化评估的现状。如下图所示,DriveLM 提供了从物体识别、物体运动状态判断到物体未来运动轨迹预测、自车运动规划的完整逻辑链条,确保了整个决策过程中每一步的合理性和可解释性。

  • 全栈数据覆盖

DriveLM 的标注覆盖了自动驾驶系统中的感知(perception)、预测(prediction)、规划(planning)等模块,为整个自动驾驶系统提供了全栈式的语言标注数据。

  • 假设推理

DriveLM 的标注中包含了基于假设进行推理的内容("What if..."),这有助于训练模型对尚未发生的未来事件进行预判。

  • 驾驶目标分解

DriveLM 提供了场景级别的全局驾驶目标描述和对应的帧级别的驾驶目标描述,引入了驾驶目标分解任务。通过将复杂的宏观驾驶任务分解为更具体、更简单的子任务,让自动驾驶系统学会应对更复杂多变的交通环境。

DriveLM | 数据与标注

DriveLM 标注中不同类别问题的分布情况

DriveLM 是一个基于 nuScenes 自动驾驶数据集构建的、以关键帧描述 + 问答对(Description+Q&A)为核心的数据集。

小米civi2是曲面屏吗

数据集中的问答对主要可以分为三类:感知(Perception)、预测(Prediction)和规划(Planning)。感知部分着重于询问物体相对自车的位置或运动状态;预测部分询问车辆或行人的未来可能行为和状态;规划部分询问自车可以采取的行动。

整个数据集分为训练集和验证集两部分,训练集共包含697个场景,验证集包含150个场景。每个场景包含大约40帧(采样频率约为2赫兹),标注员会在其中选择4-8个关键帧进行标注。

想要了解数据集的更多细节,请参考 OpenDriveLab 发布在 Github 上的 DriveLM 演示数据。


返回网站首页

本文评论
探讨校招新走向 北森发布《2021中国企业校园招聘白皮书》(北森云校园招聘)
  近日,从95、00后为主的Z世代年轻人的特点出发,北森人才管理研究院发布了《2021中国企业校园招聘白皮书》,对企业校园招聘的规划和实施进行了深入探讨。   新风向:校招运...
日期:07-17
云业务放缓致微软第四财季业绩不及预期,净利增速两年新低_微软公布第四财季
记者 杨阳   云业务拖累微软最新一季营收不及预期。   美东时间7月26日盘后,微软公布截至6月30日的2022财年第四财季财报,第四季度微软营收为518.7亿美元,低于分析师预期的...
日期:07-31
网络货运平台办法_《互联网货运平台安全运营规范》发布
  1 月 5 日消息,近日,中国交通运输协会发布了《互联网货运平台安全运营规范》(下称《规范》)团体标准,这是中国首个互联网货运安全团体标准,该团标将于 2022 年 3 月 1 日起...
日期:07-17
顾客吐槽看《阿凡达2》需30元购3D眼镜 凭啥买非常不合理:影院回应
你去电影院看《阿凡达2》了吗,是不是也遇到了下面不爽的一幕?三星note20是高端机吗苹果称未就收购TikTok进行磋商近日,安徽宿州。有市民称12月18日看《阿凡达2》时被要求30元购...
日期:12-27
“电脑眼”威胁六成白领  360调查:七成网民忽视眼睛健康
  看电脑时间稍久,眼睛就觉得干涩、发痒?长期熬夜加班后,眼睛酸胀老想着用力闭眼,严重时还会视线模糊、头晕眼花?如果经常有以上症状,那么你就要提高警惕了:你很有可能已患上了...
日期:07-22
小红书直播人气榜规则「小红书公布时尚主播成长计划以及双11直播间激励政策」
10月10日 消息:近日,小红书直播组发布《时尚主播成长SOP》,将主播的成长过程分成冷启期、成长期、稳定期三个阶段。具体来看,冷启期即主播主要任务是熟悉直播间的操作流程和规...
日期:10-11
索尼净利润历史新高「索尼发布第二财季业绩:营业利润3440亿日元,同比增长8%」
DoNews11月1日消息(丁凡)今日,索尼集团发布2022财年第二季度财务业绩。业绩显示,第二财季销售额2.7519万亿日元,同比增长16%;营业利润3440亿日元,同比增长8%;归属于索尼集团股东的...
日期:11-02
以太坊区块链技术「以太坊“大合并”使得区块链能耗与加密代币价格双双暴跌」
随着以太坊主区块链完成从 PoW 向 PoS 模式的转型合并,网络能源成本也迎来了大幅下降。与此同时,ETH 的币价也迎来了暴跌。作为全球第二大加密代币,以太坊并未在向 2.0 版本大...
日期:09-24
特斯拉公布了什么专利「特斯拉异议特舒拉商标成功」
10 月 11 日讯:因广州睿捷汽车用品有限公司申请的“特舒拉”商标已构成使用于同一种或类似商品上的近似商标,特斯拉对“特舒拉”商标提出异议,最终,国家知识产权局决定被异议商...
日期:10-12
华为mate50官方消息「3999元起  华为Mate50E今日开启预售」
中关村在线消息:10月8日上午10:08,主打“创新本色,领势而上”的华为Mate50E即将正式开启预约,10月14日正式开售。华为官方也随手机一同为用户提供了碎屏服务宝、延长服务宝两项...
日期:10-13
女主播要生了坚持主持「“所有女生”们走上台前,助播直播为什么火了?」
声明:本文来自于微信公众号 TopKlout克劳锐(ID:TopKlout),作者:白羊,授权转载发布。11月12日,李佳琦在直播间官宣了一个名为“所有女生”的新直播间。当天晚上,旺旺以及庆子等李佳...
日期:12-03
spacex为什么那么厉害「美媒解读:为什么SpaceX能承受爆炸失败,而NASA却不能」
英伟达芯片是台积电吗 全程视频:SpaceX星舰首飞爆炸 马斯克放出最贵烟花 (来源:网易科技频道) 凡客诚品ceo4月21日消息,美国东部时间周四上午...
日期:04-21
高原之上 联通追光——记中国联通第九批援藏干部韩军峰「联通 韩勇」
高原之上 联通追光——记中国联通第九批援藏干部韩军峰 饿了么本地生活...
日期:05-31
万亿美团,大跌10%!腾讯真要减持吗?_美团 减持
文 | 唐燕飞 温婷   大股东减持的传闻引发各界猜测,在二级市场掀起波澜。   8月16日,美团股价午后持续走低,跌幅一度扩大至10%。截至收盘,股价有所回升,跌幅为9.07%。 三星最...
日期:08-20
淘宝电商保证金_阿里回应淘宝商城事件 商家2012年保证金可减半
  10月17日消息,针对淘宝商城事件,阿里巴巴今日与媒体进行沟通,阿里巴巴董事局主席兼CEO马云从美国赶到杭州参加发布会。并公布调整后的新规,所有商家2012年保证金可减半,阿里...
日期:07-24
国网山东信通公司首次通过可信WLAN网络接入超高压变电站通信运检业务
通信世界网消息(CWW)5月26日,国网山东信通公司运维人员将WAPI证书成功导入500kV齐河站智能光配业务终端,实现站内智能PDU等通信终端设备、AP至省公司主站AS服务器三元认证,标志着...
日期:05-31
爱犬跳车乱蹿 摩托车骑手高速路上抓狗:险象环生_狗撵摩托
5月10日消息,这两天,一条高速路上骑手抓狗的视频在网络上流传,引起了各方的强烈关注。据视频显示,一骑手在高速路上骑行时,原本被关在尾箱里的柴犬不知怎么就跑了出来,先是趴在了...
日期:05-10
华为P60发布时间曝光 影像实力或更强_华为p60大概什么时候上市
中关村在线消息:今日,微博博主曝光了华为P60系列的发布时间为明年第一季度,此前传出出的华为P60渲染图真实性存疑。该渲染图显示,华为P60采用了与P50相同的万象双环设计,正面屏幕...
日期:10-11
投资者心忧谷歌遭反垄断审查 佩奇能力受质疑
(小贝)北京时间6月25日消息,据国外媒体报道,谷歌承认美国联邦贸易委员会已经对其核心业务展开正式调查。在谷歌面临Facebook激烈竞争、股价承受压力的情况下,此次调查引发了投资...
日期:07-30
电信运营商战略转型面临九大依赖挑战_电信运营商面临的挑战
  从全球电信业整体来看,尽管转型旗帜已经高擎多年,但事实上面向综合信息服务提供的战略迁移只能说还在路上,尤其是转型业务对于整体收入的贡献还远远没有成为支柱。这固然...
日期:07-25