您的位置:首页 > 互联网

PyTorch大更新,编译代码速度暴增35倍!视觉模型一键部署,头显Quest 3可用

发布时间:2023-10-18 16:20:24  来源:互联网     背景:

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。

【新智元导读】最近,在Pytorch发布会上,发布移动端Pytorch解决方案ExecuTorch,实现在移动端设备上大范围地部署AI工具,并推出最新版本Pytorch2.1,推理速度大幅提升。

在刚刚召开的PyTorch大会上,PyTorch发布了一大波更新,把深度学习从业者们高兴坏了!

正式推出ExecuTorch。它可以让PyTorch在Arm、苹果和高通的处理器上运行,实现在移动端设备上大范围地部署AI工具。

伴随着这个更新,在可以预见的未来,手机,VR头显,汽车和可穿戴等移动设备将会全面AI化。

除此之外,Pytorch还宣布,torch.compile实现了对NumPy代码跟踪的支持,从而可以利用PyTorch的编译器生成高效的融合矢量化代码,而无需修改原始NumPy代码。

更重要的是,这次更新还允许通过在torch.device("cuda")下运行torch.compile来在CUDA上执行NumPy代码!

深度学习大佬Sebastian也证实,这次更新后,用PyTorch编译NumPy代码时速度暴增35倍!激动人心!

而就在前不久,PyTorch2.1也正式发布了。

这个新版本在torch.compile、torch.distributed.checkpoint中提供自动动态形状(Automatic Dynamic Shape)支持,可以在多个队列上并行保存/加载分布式训练作业,以及torch.compile对NumPy API的支持。

此外,新版本还提供了多个性能方面的改进(例如CPU电感器改进、AVX512支持、缩放点积注意力支持)以及torch.export的原型版本、健全的全图捕获机制和torch.export基于量化。

除了新品的发布,业内各路大佬都会在大会上分享关于AI模型训练,AI开源的深度见解。

ExecuTorch让AI模型部署到全平台

在这次的PyTorch Conference上,最重要的内容就是ExecuTorch的发布。

ExecuTorch是一个面向移动端的PyTorch平台,提供基础设施来运行PyTorch 程序,支持从AR/VR,可穿戴设备到标准设备上iOS和Android移动部署。

ExecuTorch的主要目标之一是实现PyTorch程序更广泛的定制和部署功能。

官方宣称这套工具使机器学习开发人员能够用更加高效的方式对各种平台上的模型进行分析和调试。

PyTorch的联合创始人Soumith Chintala称:

ExecuTorch让PyTorch能够支持移动和其他边缘设备。它将为开发人员提供一条以前不存在的发展方向,能让这些设备进行小规模,高性能的运算,并让整个社区成员都能在这些设备上加速部署自己的程序,实在是令人兴奋!

ExecuTorch让深度学习开发人员能够以组件化的方式,在各种计算平台上从头构建自己的应用,在3个方面体现出了非常强的优势:

无与伦比的便携性

与各种计算平台兼容,从性能最强劲的手机到嵌入式系统都将获得支持。

令人赞叹的生产力

使开发人员能够使用相同的工具链和SDK,在各种平台上实现PyTorch模型的设计,调试以及部署,从而大大提高生产力。

前所未有的性能表现

由于任务执行时间比较短,并且可以利用完整硬件功能(包括通用CPU和专用处理器,例如NPU和DSP)和能力,最终就可以为用户提供无缝和高性能的体验。

在官方提供的Demo中,我们可以看到,在移动端,可以轻松部署深度学习的视觉模型。

如下图,可以在终端对图像进行语义分割,分割的效果虽然比不上使用GPU推理的结果,但是相信随着终端硬件的发展,其图像处理效果会有进一步的提升。

Meta已经对这项技术进行了验证,将其应用于最新一代VR头显Quest3当中。

在PyTorch大会的主题演讲中,Meta软件工程师Mergen Nachin 详细介绍了新的ExecuTorch技术的全部内容及其重要性。

他指出,当今的人工智能模型正在从服务器扩展到边缘设备,例如移动、AR、VR和AR耳机、可穿戴设备、嵌入式系统和微控制器。

ExecuTorch通过提供PyTorch模型的端到端工作流程来交付优化的本机程序,解决了受限边缘设备的挑战。

Nachin解释说,ExecuTorch从标准PyTorch模块开始,但将其转换为exporter graph,然后通过进一步转换和编译来优化它以针对特定设备。

ExecuTorch的一个主要优势是可移植性,能够在移动和嵌入式设备上运行。

Nachin指出,ExecuTorch还可以通过跨不同目标使用一致的API和软件开发套件来帮助提高开发人员的工作效率。

Nachin表示,随着该技术现已作为PyTorch基金会的一部分开源,我们的目标是帮助行业协作解决将人工智能模型部署到各种边缘设备时的碎片化问题。

Meta相信ExecuTorch可以通过其优化且可移植的工作流程帮助更多组织利用设备上的人工智能。

极光物联科技

在PyTorch大会的主题演讲中,Meta软件工程师Mergen Nachin详细介绍了新的ExecuTorch技术的全部内容及其重要性。

作为开源的PyTorch项目的一部分,ExecuTorch的目标是进一步推动这项技术,让世界迎来在移动设备上进行AI推理的新时代。

NumPy代码编译为C++/CUDA,提速35倍!

Quansight工程师在PyTorch2.1中通过torch.compile实现了对NumPy代码跟踪的支持。

此功能利用PyTorch的编译器生成高效的融合矢量化代码,而无需修改原始NumPy代码。

它还允许通过torch.device("cuda")下的torch.compile运行来在CUDA上执行 NumPy代码。

那么,这项更新具体有多高效呢?在X(Twitter)上业界大佬Sebastian进行了测试:

他在观看Pytorch会议主题演讲之后,尝试了一下NumPy的torch.compile。

在MacBook上使用PyTorch编译NumPy代码时都能获得了大约35倍的加速,更别提对scikit-learn的影响了!

网友Anirudh Tulasi感叹道:哇,这些基准测试结果令人印象深刻!torch.compile在MacBook上如此显著地提高NumPy代码性能,真是令人震惊。这对scikit-learn等库的影响可能是革命性的。渴望看到更多的应用!

还有Ph.D说绝对需要尝试这个功能更新。

不过,在Pytorch发布会上,Sabastian还发现了一个小花絮,在新版本的Pytorch2.1其Python占比高达47.8%,比去年版本高了9.1%。

我们知道Python代码的执行效率是比C++要低很多的,然而新版本的执行速度比以前快好几倍。

一些网友表示不可思议,不敢相信自己的眼睛。

PyTorch2.1发布

本月初,官方发布了PyTorch2.1。

PyTorch2.1在torch.compile、torch.distributed.checkpoint中提供自动动态形状支持,用于在多个队列上并行保存/加载分布式训练作业,以及 torch.compile对NumPy API的支持。

此外,此版本还提供了许多性能改进(例如CPU电感器改进、AVX512支持、缩放点积注意力支持)以及torch.export的原型版本、健全的全图捕获机制和 torch.export基于量化。

除了2.1之外,官方还发布PyTorc域库的一系列测试版更新,包括TorchAudio和TorchVision。下面是最新稳定版本和更新的列表。

地址:https://pytorch.org/blog/new-library-updates/


返回网站首页

本文评论
苹果2020年第四季度财报「苹果公司将于 2 月 2 日公布 2023 年第一季度财报」
1月5日消息:苹果公司今天更新了投资者关系页面,宣布2023年第一财季(第四日历季度)的收益将于2月2日星期四分享。amd ryzen5 1600x怎么样比亚迪总经理赵长江第一季度财报电话会...
日期:01-05
抖音拿下春晚红包意在社交,不在支付_央视春晚抖音app红包
  1月26日,抖音与央视春晚联合宣布,抖音成为2021年春晚独家红包互动合作伙伴。消息一经发布,外界便纷纷猜测,抖音意在借助春晚红包争夺支付市场。毕竟,抖音支付恰巧最近在抖...
日期:07-10
江苏移动5g专属升档合约「真香通告!江苏移动5G新通话全新升级,招募10万名友好客户!」
真香通告!江苏移动5G新通话全新升级,招募10万名友好客户! 通信产业网|2023-06-15 16:44:31作者:通文来源:通信产业网拨打语音电话,可向对方传送个人虚拟形象,让通话更有趣、更亲近;...
日期:06-16
WMC2023第二届世界元宇宙大会在上海开幕
2023 年 9 月 20 日,以“虚实相生,产业赋能”为主题的WMC2023 第二届世界元宇宙大会在上海安亭隆重举行。大会由中国仿真学会、中国指挥与控制学会和北京理工大学共同主办,上海...
日期:09-21
视觉中国财报出炉:上半年净利润9087万元 暴涨65.72%「视觉中国2021年三季度业绩」
快科技8月17日消息,视觉中国发布2023年上半年财报。今年上半年,视觉中国合并层面营业收入37080.65万元,较2022年上半年同比增长5.75%。视觉中国归属母公司股东净利润9087.17万...
日期:08-17
日媒评价5G试运营:网速很快 信号太弱_5G信号太弱
  “5G 肯定比 4G 网络要快,但前提是你能找到信号。”周五,韩国三大运营商 SK Telecom、KT 和 LG Uplus 正式推出了可供大众消费者使用的 5G 商用网络。这意味着,韩国百姓可...
日期:04-14
人脸识别专治孩子冒充家长玩游戏 腾讯这波操作可以_打游戏需要人脸识别怎么办
  上周,腾讯游戏对外宣布未成年人保护工作进入全新的3.0阶段,正式升级相关保护措施:扩大人脸识别技术在游戏里的应用范围,专门针对“孩子冒用家长身份信息绕过监管”的问题,强...
日期:07-14
王小川旗下百川智能发布Baichuan-53B大模型_百川资本 那小川
8月8日 消息:据新浪科技消息,今日,王小川旗下百川智能宣布发布大模型产品Baichuan-53B。2020中国市场手机份额Baichuan-53B定位闭源大模型,目前在写作、文本创作能力方面,已经达...
日期:08-08
骁龙8 Gen3规格曝光:X4超大核 3.7GHz主频_骁龙8核处理器怎么样
高通下一代旗舰平台骁龙8 Gen3的参数被曝光了,目前来看CPU主频最高是3.7GHz,远超骁龙8 Gen2的3.2GHz,高通骁龙8 Gen3采用全新的Cortex-X4超大核。相比Cortex-X3,X4在性能上提升...
日期:06-07
电商巨头亚马逊将关闭数十个仓库,增长率跌至 20 年来低「亚马逊销量激增」
IT之家 9 月 4 日消息,咨询公司 MWPVL 表示,在线零售巨头亚马逊正在关闭或放弃在在美国开设 42 家设施的计划,总可用空间近 2500 万平方英尺。彭博社表示,亚马逊还推迟了其他 21...
日期:09-21
海底捞抄底,内伤两年
海信冰箱高端   又是大亏,还在填坑。   记者丨李惠琳 方文宇;编辑丨鄢子为   杨利娟挂帅165天后,海底捞第一份成绩单出炉。   8月14日,海底捞发布盈利预警,上半年至少亏...
日期:08-16
半年了 华为Mate X3依然供不应求:第三方渠道把价格干到了将近2万元
快科技8月28日消息,手机店主测评小铺指出,华为Mate X3供不应求,第三方渠道商把价格做到了17000-19500元。盘点各种钢铁侠游戏这款折叠屏发布于今年3月份,在过了将近半年时间后,华...
日期:08-28
刚刚 腾讯宣布大变革!互联网开启下一个时代!_腾讯创新互联网
  今天,腾讯在20岁生日之际,宣布组织架构调整方案:既保持深耕垂直领域的优势和特点,保留原有的企业发展事业群(CDG)、互动娱乐事业群(IEG)、技术工程事业群(TEG)、微信事...
日期:02-11
“马斯克去年薪酬超100亿美元”上热搜 网友:好生羡慕_马斯克身价超1000亿美元
谷歌重大事件  讯 8月22日晚间消息,根据一项最新公布的CEO薪酬调查,特斯拉CEO马斯克去年收入超过100亿美元,成为美国收入最高的CEO,这或许也是明面上能够查到的地表最高工资了...
日期:08-24
比尔盖茨支持的突破能源基金投资AI技术采矿公司KoBold_比尔盖茨 创新到零
KoBold Metals 是一家总部位于伯克利的采矿公司,利用人工智能开采稀土元素,最近完成了一轮融资,估值达到 10 亿美元,成为了一家人工智能领域的独角兽公司,并吸引了一些全球最大的...
日期:09-23
荣耀Magic 5曝光:全新年度旗舰 骁龙8 Gen 2首批「honor magic 2是5G手机吗」
十一期间,有荣耀下半年和明年初新品布局的消息传出,荣耀2023年初将会正式发布Magic 4系列手机,具体发布时间将在明年的3月左右,该机将会搭载高通在2023年的新旗舰芯片骁龙8 Gen...
日期:10-04
弹幕游戏直播在抖音火了,有主播1个月收入顶过去1年......「弹幕游戏玩法」
声明:本文来自于微信公众号 新播场(ID:New_bc),作者:小龙果,授权转载发布。还记得2021年B站爆火的弹幕互动游戏“修勾夜店”么?苹果14黄牛今年还会加价吗弹幕互动游戏,就是将观众...
日期:03-30
设计师必看!26个midjourney提示案例告诉你如何用midjourney制作广告牌样机模型
注:本文案例图片均由midjourney生成熟悉midjourney的用户应该都知道,虽然midjourney可以产生令人惊艳的图片,但却不擅长处理文字。所以,一旦涉及文字,图片的瑕疵就会比较明显。...
日期:04-26
比亚迪已成功注册“仰望”商标_比亚迪企业
11月9日 消息:11月8日,比亚迪正式公布旗下高端汽车品牌,并定名“仰望”。企查查APP显示,惠州比亚迪实业有限公司全资子公司惠州维士玛科技有限公司已成功注册1枚“仰望”商标,国...
日期:11-15
6毛钱一杯,它在抖音卖疯了_抖音一块钱六瓶可乐
声明:本文来自于微信公众号卡思数据(ID:caasdata6),作者:楼星垂,授权转载发布。“咖啡圈里,喝手磨的看不上喝美式的,喝美式的看不上喝奶咖的,喝奶咖的看不上喝挂耳的,喝挂耳的看不上...
日期:08-01