通信世界网消息(CWW)4月26日消息,2024北京国际汽车展览会(以下简称“2024北京车展”)于日前召开,商汤绝影在本届车展上首次向公众展示了面向量产的端到端自动驾驶解决方案UniAD(Unified Autonomous Driving)的道路测试表现,同时还带来了以多模态场景大脑为核心的AI大模型座舱产品矩阵以及全新座舱3D交互演示,全景展示了通用人工智能(AGI)技术驱动的未来出行全新体验。
商汤科技联合创始人、首席科学家、绝影智能汽车事业群总裁王晓刚表示:“未来汽车智能化的竞争,本质上是通用人工智能技术融合应用的比拼。商汤绝影致力于成为加速智能汽车驶入AGI时代的核心技术伙伴,给智能汽车产业带来生产效率和交互体验的双重革新,将携手合作伙伴提供通用人工智能技术驱动的智能汽车全新体验,共同定义未来出行。”
此次在北京车展上,商汤绝影以UniAD自动驾驶解决方案在无高精地图条件下,仅依靠视觉感知的实际道路测试成果。无论是复杂城市道路还是无中线的乡村道路上,车辆能高效准确地完成包括大角度左转上桥、避让占道车辆及施工区域、绕行跑步行人等一系列高难度操作。
在端到端系统基础上,商汤绝影还在本次车展期间介绍了新一代自动驾驶大模型DriveAGI,推动自动驾驶从数据驱动向认知驱动的跃迁。依托多模态大模型强大的世界理解、推理能力、决策能力以及交互能力。
联发科 光追
4月23日,商汤科技发布全新升级的“日日新SenseNova 5.0”大模型。6000亿参数的“日日新5.0”采用混合专家架构(MOE),具备更强的知识、数学、推理及代码能力。基于端云结合的架构,商汤端侧大模型大幅超越同量级大模型,越级比肩7B、13B大模型,更适合车端部署。
基于多模态大模型、大语言模型、文生图模型等能力组合,商汤绝影构建了以多模态场景大脑为核心的一系列全景感知、主动关怀且富有创造力的大模型座舱产品。
据了解,商汤绝影正在打造的敏锐洞察、深度思考、高效执行的多模态场景大脑,是助力智能汽车迈向AGI时代的核心产品之一。通过应用场景和用户需求驱动,多模态场景大脑让智能汽车可以高效准确地全景感知和深度理解用户需求和周围环境,并以场景大脑为核心打通不同应用,将离散的单点功能聚合在一起,从而为用户提供更多深度个性化的主动关怀和服务。
其中,基于地理位置推荐符合用户喜好的餐厅、介绍用户感兴趣的外部自然景物,并进行优质景点推荐是绝影AI大模型座舱产品的基础功能。凭借强大的多模态感知能力,搭载商汤绝影方案的车辆能够准确感知并识别车外的信息,包括周围车辆的车型、标志性建筑物等,以语音、图片或者视频等方式为舱内人员提供更为准确和全面的内容,帮助用户了解和掌握外部环境信息。
此外,以多模态场景大脑为核心,商汤绝影还能提供更多基于汽车场景的AI大模型座舱产品。以商汤“大医”医疗健康大模型为桥梁的“旅医”,让用户在座舱内就可以获得专业及个性化的健康管理服务。基于AIGC大模型技术的“神笔”,可以把用户简单的绘画线条转变成具有美感的艺术作品,增添驾乘乐趣。