您的位置:首页 > 互联网

火山引擎cdp「没有大招的火山引擎,拿下70%大模型玩家」

发布时间:2023-04-20 12:40:24  来源:互联网     背景:

声明:本文来自于微信公众号 量子位 (ID:QbitAI),鱼羊 发自 凹非寺,授权转载发布。

有没有在开发大模型?在学习

小米ultra11传感器

什么时候发布大模型?没计划

当被问起自研大模型,字节跳动副总裁杨震原口风甚严。但席卷全球的这场大模型竞逐战,没有人会主动放弃阵地。

最新线索,在上海露出端倪。

火山引擎对外的最新技术、产品发布动作中,我们发现:炼大模型的基础设施,不仅已经在字节内部运转,还到了能够对外输出“技术秘籍”的阶段

直观的数字,更能说明情况:

抖音2022年最火特效「AI绘画」,就是在火山引擎机器学习平台上训练而成。在训练场景下,基于Stable Diffusion的模型,训练时间从128张A100训练25天,缩短到了15天,训练性能提升40%

在推理场景下,基于Stable Diffusion的模型,端到端推理速度是PyTorch的3.47倍,运行时对GPU显存占用量降低60%

而就在全球最大云厂商AWS宣布,加入大模型竞赛,并且定位是“中立平台”,会接入Anthoropic、StabilityAI等模型厂商的大模型之际,量子位也获悉:

三星s207月更新

火山引擎,也在以类似路径探索大模型的落地,做法是用“机器学习平台+算力”为大模型企业提供AI基础设施。火山引擎总裁谭待透露,国内几十家做大模型的企业,七成已经在火山引擎云上。

大模型企业为什么会选择火山引擎?我们和火山引擎机器学习总监吴迪聊了聊。

大模型趋势,写在云计算的最新技术里

在AI方面,此番火山引擎重点提到了两个平台:机器学习平台推荐平台

机器学习平台

其中,机器学习平台涉及当下科技圈最热的两个话题——庞大算力的调度问题,以及AI开发的效率问题。

先来看算力调度

说到大模型时代,OpenAI首席执行官Sam Altman曾发表观点称,“新版摩尔定律很快就要到来,宇宙中的智能每18个月翻一倍”。

而这背后,模型训练开发所需要的算力规模,可想而知。

但用算力,实际上并不是一个纯堆硬件的事情。举个例子,如果机器学习框架跟底层的硬件是各自独立的一套,那在训练AI模型时,由于通信延迟、吞吐量等问题,训练效率就无法最大化。

简单来说,就是很多算力会在这个过程中被浪费掉。

解决方法,是软硬一体

吴迪介绍,火山引擎的自研DPU,将算力层和平台层统一起来进行了整体优化。比如,将通信优化的算法直接写到网卡硬件中,以降低延迟、削减拥塞。

测试数据显示,火山引擎的通信框架BytePS,在模型规模越大时,收益会越高。

火山引擎 中标

而在AI开发效率方面,火山引擎推出了Lego算子优化

具体而言,这一框架可以根据模型子图的结构,采用火山引擎自研高性能算子,实现更高的加速比。

前文提到的抖音特效训练效率的提升,就得益于此:

在推理场景下,使用Lego算子优化,可以将基于Stable Diffusion模型的端到端推理速度提升至66.14it/s,是PyTorch推理速度的3.47倍,运行时GPU显存占用量降低60%。

在训练场景下,在128张A100上跑15天,模型即可训练完成,比当时最好的开源版本快40%。

火山引擎cdp

目前,火山引擎这一套机器学习平台,已经部署到了MiniMax的文本、视觉、声音三个模态大模型训练和推理场景中。

MiniMax联合创始人杨斌说,依托火山引擎机器学习平台,MiniMax研发了超大规模的大模型训练平台,高效支撑着三个模态大模型每天千卡以上的常态化稳定训练。在并行训练上实现了99.9%以上的可用性。除了训练以外,MiniMax也同步自研了超大规模的推理平台,目前拥有近万卡级别的GPU算力池,稳定支撑着每天上亿次的大模型推理调用。

有稳健的大模型基础设施,MiniMax从零开始自主完整地跑通了大模型与用户交互的迭代闭环,实现从月至周级别的大模型迭代速度,和指数级的用户交互增长。MiniMax和火山引擎一起为大模型训练搭建了高性能计算集群,一起致力于提升大模型训练的稳定性,保证了千卡训练的任务稳定运行数周以上。

从今年开始,MiniMax又和火山引擎在网络和存储上进行了更深入的优化合作,实现更低的网络延迟,将带宽利用率提升了10%以上。

吴迪坦言,“软硬一体、通信优化、算子优化都不是新概念,火山引擎机器学习平台也没有特别牛、特别超前的大招。我们靠的就是务实严谨地不断把细节做扎实,把重要技术锤炼到位,这样才能赢得客户的信任。”

推荐平台

机器学习平台之外,这次在自家看家本领——推荐系统上,火山引擎对外拿出了推荐系统全套解决方案:从物料管理,到召回排序,再到效果分析、A/B测试和模型算法,都可以开箱即用

而作为产业界近年来落地最为成功的AI应用之一,在推荐领域,深度学习模型越来越大、越做越深的趋势,也早已显现其中。

吴迪介绍,由于推荐是一个高度定制化的场景,每个人的兴趣、画像都有单独的embedding,因此大规模稀疏模型很重要。

同时,由于真实世界在时刻变化,因此背后又存在一重实时训练的挑战。

这都对传统的深度学习框架提出了很大的挑战。

为此,火山引擎不仅将以上工程实现进行封装,推出了基于TensorFlow的机器学习训推一体框架Monolith,还拿出了针对智能推荐的高速GPU训练和推理引擎——Monolith Pro

值得关注的是,Monolith Pro覆盖的场景包括:

  • 针对关键场景的超大模型,使用高密度GPU进行超高速训练;

  • 覆盖更多场景的模型,混合使用CPU+GPU高速训练。

吴迪进一步解释说,推荐模型需要做大做深,才能对众多事物之间的关联有更好的理解——这一点,如今已经在GPT引发的一系列现象上得到充分验证。

因此在现在这个时间点,对于任何正在开展推荐广告业务的公司而言,高价值的数据是一方面,另一方面,找到训练更强、更大、更实时模型的方法,对整个系统进行智能化升级,已经到了一个关键期。

火山引擎 中标

火山引擎解决方案

所以,Monolith Pro又具体能实现怎样的效果?吴迪透露,基于Monolith Pro,抖音内部的某重要广告场景,原本一次广告训练需要15个月样本,训练时间为60小时,现在只需要5小时就能完成。

工程师可以做到上午启动训练,下午就能开A/B测试了(笑)。

大模型改写云计算规则

由ChatGPT而起,在海内外一波波大模型的发布中被推至高潮,一场新的技术变革已然势不可挡。

云计算,作为一个早已深深与AI关联的业务,站立桥头,也最早面临着规则被重新改写的境况。

随着大模型能解决越来越多下游任务,如何用大模型,又成为了新的问题:无论是训练还是推理,大模型都需要很强的基础设施支持。

云计算成为了最便捷的上车途径。同时,云厂商们也势必要面向大模型,重塑自身云产品的面貌。

吴迪认为,作为一项技术,未来大模型会是百花齐放的局面。丰富的需求会催生出若干成功的模型提供商,深入满足千行百业的业务需求。

与此同时,大模型的应用也面临若干基础问题:

  • 基础大模型可能还需要用更多高质量数据,做进一步的增量学习和finetune,才能真正在产业中落地应用。整个流程需要更为敏捷和易用。

  • 大模型将成为大数据时代的“中央处理器”,它能够控制插件、接口,以及更丰富的下游模型。大模型需要这些“手”和“脚”,才能进入我们生活的方方面面。

  • 随着大模型应用的增多,数据安全和信任将成为产业关注的焦点。

  • 推理效率。大模型的训练成本高昂,但长期来看,全社会投入在大模型推理上的开销将逐渐超过训练成本。在微观上,能以更低单位成本提供大模型相关服务的公司,将获得竞争优势。

但可以肯定的是,大模型改造各行各业的浪潮已至。

有人正面迎战,有人从更底层的问题出发,尝试破解新的问题和挑战。

共同点是,大模型的潮头来得迅猛激烈,但在第一线迎接风暴的,从来不是没有准备之人。

现在,到了检验真正AI能力和积累的时刻。至少在与大模型相伴相生的云计算领域,精彩才刚刚开幕。


返回网站首页

本文评论
微软2011首次安全更新发布 IE漏洞未修复(微软公司通常在发布最新的系统漏洞补丁)
  北京时间1月12日消息,今日凌晨微软发布2011年首次安全更新,共发布两个补丁,用于修复Windows Vista和XP系统中的3处漏洞。然而令人费解的是,此前公开曝光的IE 浏览器和Windo...
日期:07-25
今日头条:加强 MCN 规范运营,不得编造虚假情节 / 刷量控评
  12 月 22 日消息,今日头条今日发布《关于加强 MCN 规范运营的公告 (第一期) 》。公告表示,为打造清朗的网络生态环境,营造安全、健康、 绿色的网络空间,更好维护 MCN 的正...
日期:07-17
为什么是佐藤恒治?丰田换帅的背后「佐藤健为什么这么帅」
撰文/ 张霖郁编辑/ 黄大路设计/ 赵昊然“您为什么选择佐藤恒治做接班人?”主持人问丰田章男。“首先他年轻,第二佐藤非常喜欢汽车,同时也非常喜欢造车。你和他聊几分钟,会发现‘...
日期:01-29
《阿凡达》重映3天票房过亿「《阿凡达2》上映14天票房突破8亿元:成绩或难“封神”」
根据灯塔专业版数据,截止今天16时2分,《阿凡达2:水之道》的国内票房正式突破8亿大关。从12月25日突破7亿算起,这一亿票房《阿凡达2》用了4天的时间,与此前一路高歌猛进的景象形...
日期:12-30
谷歌与英国公民咨询局合作提高网络安全性的建议_谷歌与英国公民咨询局合作提高网络安全性
  据国外媒体报道,谷歌已与英国公民咨询局(Citizens Advice Bureau)联手启动一项新计划以提高网络的安全性。   一家国外媒体报道称,此番搜索引擎巨头谷歌和独立机构将会...
日期:07-24
两用户在抖音中相互谩骂毁名誉 法院:应相互赔礼道歉「抖音评论负法律责任吗」
12月9日 消息:据西平法院消息,近期,河南省西平县人民法院审结了一宗名誉权纠纷案件。夏某、杜某均系“抖音” 软件用户,二人曾分别与“某大哥”系网络好友,“某大哥”曾将其个人...
日期:12-10
快手:1-8月头部客户新增2.6倍 将帮助5000万创作者获得收入_快手80万粉丝能赚多少钱
(ChinaZ.com) 9月23日 消息:今天,快手高级副总裁马宏彬在磁力引擎双产品升级发布会上公布了快手的最新运营数据。数据显示,今年1- 8 月,快手商业化营收相比去年增长了2. 5 倍,头...
日期:08-01
孟晚舟当值董事长首秀:华为预计到 2030 年 AI 计算能力将增长 500 倍_华为ceo孟晚舟新进展
4月20日消息:2023 华为全球分析师大会日前在深圳举行,本届大会将以「跃升数字生产力,加速迈向智能世界」为主题。华为副董事长、轮值董事长 CFO 孟晚舟上台并进行了发言。goog...
日期:04-20
流媒体引领好莱坞:Netflix 再成奥斯卡大赢家,苹果突飞猛进_netflix流媒体平台
  没人可以否认,好莱坞已经进入流媒体引领行业的时代。或许未来,整个行业都会走向流媒体。   2022 年的奥斯卡,看起来 Netflix 又会成为主角。第 94 届奥斯卡颁奖典礼将...
日期:07-17
三星预热最新Exynos芯片(三星exynos2100发布会)
  10 月 4 日消息 今日下午 5 点,三星 Exynos 官方微博预热光线追踪技术,光线追踪是桌面级 GPU 中支持的高级图形显示技术。   据悉,三星将和 AMD 合作推出新款 Exynos 旗...
日期:10-03
资本催熟的独角兽,失去明星光环保护色
声明:本文来自于微信公众号 Tech星球(ID:tech618),作者:翟元元,授权转载发布。2017年,奢侈品电商寺库赴美上市,成为中国“奢侈品电商第一股”,一时风光无两,发行价每股13美元,股价最高...
日期:10-22
美股周四:三大股指全线上涨,英伟达涨超14%,奈飞跌超3%「美股三大股指大涨」
美国时间周四,美股收盘主要股指全线上涨,标普500指数结束年内最长天数连跌。投资者关注美国经济和就业市场数据,并权衡美联储未来加息前景。道琼斯指数收于33153.91点,涨幅0.33%...
日期:02-25
印度苹果工厂遭打砸后续「苹果印度工厂大火:损失8300万」
当地时间2月27日,苹果数据线供应商Foxlink在印度的一座工厂突然发生火灾,导致将近一半的机器损毁,损失超过1200万美元(折合人民币超过8300万元)。工厂发生火灾,直到下午4时才被...
日期:03-01
以太坊 8 年挖矿时代结束:V 神、中国矿业,与英伟达「以太坊一台矿机收益」
最后的以太坊矿工,与中国「挖矿」简史。来源:律动 BlockBeats原作者:Jack原标题:以太坊 8 年挖矿时代结束:V 神、中国矿业,与英伟达编者按:2022 年 9 月 15 日 14 点 42 分,成立 8...
日期:09-18
QQ邮箱最大“羊毛”没了!最大免费容量16G 扩容15元每月「qq邮箱有多少容量」
QQ邮箱作为国内老牌邮箱,也是目前国内最流行的邮箱之一,除了QQ号直接当做邮箱较为方便之外,其功能性体验也很是在线。对于经常有大文件传输需求的朋友来说,QQ邮箱绝对是个良心存...
日期:11-14
放弃支持 SQL 惹争议,CEO:你可以怪我!
声明:本文来自于微信公众号CSDN(ID:CSDNnews),作者:苏宓,授权转载发布。作为关系型数据库的标准语言,SQL 凭借着功能丰富、使用方便灵活、语言简洁等特性备受欢迎,行业中如 MySQL、O...
日期:10-13
红杉中国宣布成立创业加速器YUÈ 沈南鹏带队服务天使轮到A轮
讯 8月15日上午消息,红杉中国宣布成立创业加速器YUÈ,为处于天使轮到A轮的中国创业者提供红杉独家研发的体系化创业课程和资源服务。   据了解,YUÈ的定位为“中国创业者的第...
日期:08-16
快手电商时代「快手电商“新”逻辑」
声明:本文来自于微信公众号 亿邦动力(ID:iebrun),作者:亿邦动力,授权转载发布。眼下,双11的“战火”已全面燃起,各大电商平台如何为商家创造新增长成为行业焦点。9月29日,以“新增...
日期:10-05
RTX 4090频频烧毁 终于要改了!但不能根治
近期,RTX 4090 16针供电接口频频烧毁的问题引发广泛关注,但无论是PCI-SIG组织还是NVIDIA、AIC厂商,都没有给出明确的说法和解决方案。据外媒报道,PCI-SIG组织正在考虑对12VHPWR...
日期:11-11
京东618手机狂欢城_京东618手机巅峰日喊你来“占便宜”,手机服务包低至9.9元起
  想要趁京东618大促换手机,但没赶上开门红第一波福利?小伙伴们别气馁,错过的并不都是遗憾。6月9日,京东将联合华为、小米、荣耀、iQOO、realme、一加、ROG、黑鲨、海信、中...
日期:07-10