您的位置:首页 > 互联网

稚晖君开源百万机器人真机数据集_稚晖君个人网站

发布时间:2024-12-31 03:15:23  来源:互联网     背景:

声明:本文来自于微信公众号 量子位 | 公众号 QbitAI,作者:衡宇,授权转载发布。

年末大礼包,稚晖君他又双叒来开源了!

百万真机数据集开源项目AgiBot World,也是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。

该项目由稚晖君具身智能创业项目智元机器人,携手上海AI Lab、国家地方共建人形机器人创新中心以及上海库帕思联合发布

GitHub和抱抱脸上已经可以自取了(本文文末附直通车)~

稚晖君开源的网址

说起来,此前在该领域在全球内,不是没有玩家做过大规模的数据集:

比如谷歌DeepMind曾构建过Open X-Embodiment数据集,数据整合自22种不同本体的机器人。

但其中大部分数据缺乏统一标准化的采集流程,且许多用于数据采集的机器人构型已经过时,数据质量格式参差不齐——这就可能在机器人策略学习过程中带来副作用。

稚晖君个人网站

谷歌DeepMind的Open X-Embodiment

又比如斯坦福、UC伯克利、谷歌等构建的DROID数据集,涵盖了相对丰富的场景与技能,虽然尽可能实现规范化的数据采集流程。

但作者团队自己在后续研究中指出,DROID存在大量低质量数据,反而让机器人越学越迷茫。

2024年以来,具身智能备受瞩目,行业玩家纷纷涌现,很多初创公司都基于自采集的大规模高质量双臂机器人数据训练的模型展现出了整理、分拣、洗衣等执行复杂动作的能力。

这虽然进一步印证了高质量数据在当前具身智能领域研究阶段的重要性,但这类数据集一般仅作自用

据介绍,相比于Open X-Embodiment数据集,此次开源的AgiBot World长程数据规模高出10倍,场景范围覆盖面扩大100倍,数据质量从实验室级上升到工业级标准。

一起来看看,这个数据集包含了些什么——

日常生活中多样化任务,可多机器人协作

官方资料显示,AgiBot World数据集收录了80余种日常生活中的多样化技能

从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。

下面举几个栗子~

毫米级精细控制

演示场景为插内存条。需要如神经纤维般灵敏的末端触觉传感器助力机器人精准对接,稍有不慎可能导致设备损坏。

稚晖君 主页

繁琐长流程家务整理

该任务下演示场景1为整理洗碗机。

画面中,勺筷碗盘层层堆叠在洗碗池里。在这条数据中,机器人将杂乱的餐具逐一整理到洗碗机相应卡槽中。

稚晖君 博客

该任务下演示场景2为挂式熨烫衣物。

机器人通过双手协作,一只手抓住衬衫的一角,另一只手控制挂烫机与衣物的距离,熨烫衣物褶皱。

github稚晖君

搭建物体搬运

搬运大件物体这项任务,目前对单机器人来说是个老大难。

数据集中采集的是双机器人协作,分担重量的同时,通过实时调整位置与角度,确保物体搬运过程中的稳定安全。

稚晖君开源的网址

尽可能覆盖日常生产、生活全域场景

团队介绍,AgiBot World是从智元机器人自建的大规模数据采集工厂与应用实验基地中采集的,采集空间总面积超过4000平方米,包含3000多种真实物品。

github稚晖君

‍为了尽可能覆盖机器人在生产、生活中的典型应用需求,为机器人提供高度真实的生产生活环境,采集环境包含超过100种真实场景、3000多种物品

其中,80%的任务为长程任务,时长集中在60s-150s之间,且涵盖多个原子技能,是DROID和OpenX-Embodiment‍工作的5倍。

up主 稚晖君

值得一提的是,按照日常生活真实需求,团队主要复刻了5个核心场景,分别是:

家居(40%)、餐饮(20%)、工业(20%)、商超(10%)和办公(10%)。

主打的就是通过多场景的高度还原与任务设计,为机器人研发和测试构建一个能够实现具身智能的必要条件。

up主 稚晖君

首先,家居场景。

主要再现真实住宅布局,包括卧室、客厅、厨房、卫生间等核心空间。有助于训练机器人家务清洁、物品整理和厨房任务等。

在客厅,机器人可以精确控制机械臂抓取花材,精确定位花瓶的插孔,将花朵按计划插入适当位置。

稚晖君开源的网址

也可以使用清扫工具对地面进行全面清洁,包括碎屑、灰尘和液体等。

稚晖君个人网站

‍还可以清理家居表面的灰尘和污垢,精确控制掸子或软布进行擦拭,避免划伤表面。

稚晖君个人主页

让我们把视线从客厅转换到厨房。

在厨房,机器人可以根据食材种类和沙拉配方,完成切割、混合和装盘操作,也可以控制清洁工具对瓶内外进行刷洗,去除污渍。

稚晖君的开源

如果再把场景切换到卫生间,机器人可以精准控制机械臂使用刷子清洁卫生间马桶。

稚晖君的开源

李佳琦选品严格吗

其次,餐饮场景。

主要实现智能服务体验,模拟前厅、后厨与用餐区域,包括点餐台、备餐区、餐桌等。有助于训练机器人实现餐厅服务(点餐、上菜、清理餐桌)、食材传递、后厨协作等。

再者,工业场景。

主要模拟分拣与物流自动化,复刻工业仓库与生产线,包括分拣系统、打包设备、传输带等。有助于训练机器人实现物料分拣、包装打包、物流搬运等。

在工厂,机器人在流水线上利用机械臂精准控制将物品放入指定的包装盒中,实现物品自动打包。

稚晖君个人主页

还有商超场景。

这一场景下,主要高度还原超市货架布局与收银区设计,包含生鲜、日用、冷冻等多个品类区域。有助于训练机器人模拟物品上架、货物盘点、顾客引导、无人结算等。

在超市,机器人可以精准控制扫码枪对待结算物品进行扫描和帮助客人装袋。

稚晖github

采集本体过硬+严控数据质量

上面所提到的AgiBot World的所有数据,都是由下面这款机器人采集的:

github稚晖君

它具有以下几个特点:

  • 360°感知:8个摄像头环绕式布局,实时全方位感知周围环境的动态变化。

  • 灵巧操作:可配备具有6个主动自由度的灵巧手,保障动作精准且灵活,完成多种复杂操作。

  • 末端精细感知:标配末端六维力传感器,并可配备高精度视触觉传感器,能够感知力的微小变化,做到“拿捏有度”。

  • 高自由度:全身最高32个自由度,应对洗衣、做饭、分拣、搬运等复杂任务。

此外,由于AgiBot World的超大规模真实数据特性,团队通过专业培训、多级质量把控、全程人工在环,以确保严格精细化控制数据质量。

任务设计环节,AgiBot World从设计初稿到设计迭代流程,均邀请了学术、工业、消费者来进行多视角任务把关。

数据采集环节,由管理体系下的专业管理图那对来保障采集员培训和采集质量把控。

审核标注环节,首先会经过端云两侧,严格筛选采集的数据,自动剔除不符合要求的数据。

此外专业审核员会人工对全量数据进行逐帧审核,确保每一个动作都符合任务标准,并对关键帧和数据特性进行多维度标注。

算法验证环节,通过人工审核的数据,还会由AgiBot World团队进一步通过算法进行验证。

对于未能通过验证的数据,会重新设计任务进行数据补采,确保数据可用性。

稚晖君个人网站

One More Thing

这次开源AgiBot World数据集,是稚晖君在三个月内的第三次开源举动

第一次是9月底,开源了专为具身智能打造的轻量化、高性能通信框架AimRT。

上一次是10月24日(没错就是踩点1024),智元人形机器人灵犀X1全套资料全球开源,包括设计图纸和代码。

稚晖君 博客

至于下一步——

量子位得来的消息是,开源,开源,还是开源(莫不是稚晖君想做源神)。

内幕消息一并放在这里,大家就等着他慢慢慢慢慢慢填坑吧,真的(真诚脸.jpg)。

  • 百万真机全量数据将陆续开源;

  • 千万仿真数据同步推送,支持更泛化和更通用的大模型训练;

  • 发布具身基座大模型,支持模型微调,赋能千行百业;

  • 发布全套工具链,实现采集、训练和评测完美闭环;

  • 举办一系列AgiBot World Challenge

GitHub链接:

https://github.com/OpenDriveLab/AgiBot-World

抱抱脸链接:

‍https://huggingface.co/agibot-world

项目主页:

https://agibot-world.com/


返回网站首页

本文评论
苹果良心一回!iPhone 16 Pro直接256GB存储起步_苹果pro16英寸
快科技4月16日消息,据多方报道,今年的iPhone 16 Pro起步存储提升至256GB,且售价可能维持999美元(国内起售价为7999元)不变。中国光棍节网购事件点评这一变化与去年的iPhone 15 Pr...
日期:04-16
单价6.5亿 国产大飞机C919斩获30架订单:海航下单_国产大飞机c919首单
国产大飞机C919今年5月28日已经由东航正式投入商业运营,今年预计会接收5架C919,其他航空公司也在陆续跟进,海航航空今天宣布旗下子公司金鹏航空就签订了30架C919的协议。据海航...
日期:07-13
网易代理 《宝可梦大探险》国服宣布停服:2025年2月终止运营_网易宝可梦大探险上线时间
快科技9月11日消息,今日,《宝可梦大探险》官方宣布,《宝可梦大探险》将于2025年2月终止运营,预计2024年11月停止下载、注册和充值,具体停运安排以后续正式停运公告内容为准。官方...
日期:09-12
重启进入BFU状态 苹果iOS-18.1防盗新措施,iPhone四天未被使用_苹果重启base
 11 月 12 日消息,404 Media 上周披露的一份美国警方文件显示,推测苹果在 iOS 18 系统中部署了额外安全层,通过和其它 iPhone 秘密通信实现重启。安全研究员 Jiska Classen 于...
日期:11-12
B2R电商模式引关注 梦饷科技入选2024年上海市重点服务独角兽榜单
【】4月30日消息,近日,《2024年上海市重点服务独角兽(潜力)企业榜单》正式发布,梦饷科技再次登上榜单,其代表的B2R电商模式也再度引发关注。此次共遴选重点服务独角兽(潜力)企业156...
日期:05-02
超轻薄 高续航 TCL华星供屏传音旗下首款翻盖式折叠PHANTOM V Flip 5G_tcl华星t9
9月22日,传音在新加坡举行的TECNO全球旗舰新品发布会2023上,重磅发布了旗下首款翻盖式折叠手机-TECNO PHANTOM V Flip 5G 。作为传音在柔性折叠显示领域的里程碑式产品,PHA...
日期:09-28
AION RT直冲小鹏MONA M03而来 这两台车怎么选?_小鹏aeb
AION RT直冲小鹏MONA M03而来 这两台车怎么选?  【CNMO科技消息】随着新能源汽车市场的激烈竞争,A+级家轿成为了各大车企的主战场。小鹏新推出的MONA M03作为其中的新秀,凭借...
日期:09-20
“‘团结湖杯’数智重庆·全球产业赋能创新大赛”京津冀区域赛决赛在京举行
  当下,以人工智能、大数据为代表的新兴科技正在与产业场景加速融合,并催化出了全新的业态,无数优质项目犹如雨后春笋般冒了出来,为了能让这些优质项目能够迅速得到资本市场...
日期:12-21
谷歌发布PaLI-3视觉语言模型 小体量达到SOTA!
要点:1. 谷歌发布了一款名为PaLI-3的视觉语言模型,它在更小的体量、更快的推理速度下取得了更强的性能,在多个任务中达到了SOTA水平。七彩虹rtx3060ti显卡一键超频2. PaLI-3采...
日期:10-27
小米卢伟冰:Redmi K60 Pro暂时没有计划推出1TB版本机型
有网友在微博上询问Redmi K60 Pro是否会推出1TB版本,卢伟冰回应称目前没有计划。据悉,Redmi K60 Pro当前拥有四个存储规格,分别为8GB 256GB、12GB 256GB、12GB 512GB和16GB 512...
日期:06-10
小米13 Pro曝光:有4种配色和素皮版本!_小米pro哪个颜色好看
今天,有数码博主在社交平台暗示称,小米13 Pro将提供四种配色,分别是黑色、白色、绿色和粉色,其中,绿色和粉色是PU素皮材质,而黑色和白色则没有明说。据该博主透露,小米13系列工程机...
日期:11-05
知乎AI革命:智能搜索与实时问答的融合_知乎ai革命:智能搜索与实时问答的融合
声明:本文来自于微信公众号 硅星人Pro(ID:Si-Planet),作者:骆轶航,授权转载发布。小米十一实体店售价在生成式人工智能(Generative AI)的信息技术跃迁背景下,如何看待知乎当下和未...
日期:03-29
日本首都东京的由来「日本首都东京所有政府部门 8 月起全面引入生成式 AI」
6 月 13 日消息,据日本《产经新闻》报道,东京都知事小池百合子今日宣布,东京都所有的政府部门都将引入以 ChatGPT 为代表的生成式 AI,该计划将于 8 月起全面施行。小池百合子是...
日期:06-14
索尼xperia 1 vi手机渲染图索尼Xperia 1 VI手机设计图公布 白色、黑色渲染图曝光
来源:中关村在线据最新消息,索尼Xperia 1 VI手机预计将于本月底发布。最近,国外科技媒体公布了一系列高清渲染图。这些渲染图展示了该机的黑色和白色两种颜色款式。华为麦芒6是...
日期:05-04
iphone15郭明錤最新消息","info":{"wordid":"7080494027049375013"}},{"
来源:中关村在线北京市禁毒委员会据郭明錤预测,苹果在2023年第四季度的iPhone业务营收和利润将超过预期,这一结论基于iPhone 15、iPhone 15 Pro的初销售情况。郭明錤认为,苹...
日期:09-24
销售超500万杯,​奈雪超大桶凭什么受欢迎?
声明:本文来自于微信公众号 营销兵法(ID:lanhaiyingxiao),作者:兵法先生,授权转载发布。新茶饮无疑是近年的热门品类之一,市场容量大、用户关注度高、营销花样多以及受到资本的追...
日期:07-02
网友称用ChatGPT后被海外大学录取:几秒钟就写出来了
2月24日消息,23岁的自由艺术家Jason申请海外大学研究生,在收到拉夫堡大学的拒信后用ChatGPT写了申诉邮件,并得到拉夫堡大学关于考虑的回应,多次沟通后拿到offer。小鹏汽车注册资...
日期:02-26
右来了官网「右来了科技出席重量级数智化论坛,推动国有企业转型升级」
如今,高质量发展成为了新时代的重要命题。企业作为经济发展的重要载体,需要应对时代要求,不断进行转型升级,才能提质增效,增加自我经济效益的同时,为经济增长贡献力量。右来了科技...
日期:08-27
AI文本生成动漫图片工具——Yodayo AI 含40种虚拟主播模型「ai虚拟主播制作软件」
8月7日 消息:Yodayo AI 是一款先进的人工智能系统,旨在生成免费且最好的 AI 动漫图像。它采用了创新的深度学习算法和生成对抗网络(GANs)等先进神经网络架构。Yodayo AI 不仅可...
日期:08-07
华为李加赞:内生安全,构筑通信网络基础设施安全底座
华为李加赞:内生安全,构筑通信网络基础设施安全底座 通信产业网|2024-07-19 20:12:17作者:通文来源:华为【通信产业网讯】7月19日,在上海世博中心举办的2024中国联通合作伙伴大会...
日期:07-20