您的位置:首页 > 互联网

延迟降低2倍!英特尔披露至强6处理器针对Meta Llama 3模型的推理性能_英特尔至强系列处理器

发布时间:2024-04-20 13:08:53  来源:互联网     背景:

4月20日消息,近日,Meta重磅推出其80亿和700亿参数的Meta Llama 3开源大模型。该模型引入了改进推理等新功能和更多的模型尺寸,并采用全新标记器(Tokenizer),旨在提升编码语言效率并提高模型性能。

至强六代处理器

intel至强处理器性能排名

在模型发布的第一时间,英特尔即验证了Llama 3能够在包括英特尔至强处理器在内的丰富AI产品组合上运行,并披露了即将发布的英特尔至强6性能核处理器(代号为Granite Rapids)针对Meta Llama 3模型的推理性能。

英特尔至强处理器可以满足要求严苛的端到端AI工作负载的需求。以第五代至强处理器为例,每个核心均内置了AMX加速引擎,能够提供出色的AI推理和训练性能。截至目前,该处理器已被众多主流云服务商所采用。不仅如此,至强处理器在进行通用计算时,能够提供更低时延,并能同时处理多种工作负载。

事实上,英特尔一直在持续优化至强平台的大模型推理性能。例如,相较于Llama 2模型的软件,PyTorch及英特尔PyTorch扩展包(IntelExtension for PyTorch)的延迟降低了5倍。这一优化是通过Paged Attention算法和张量并行实现的,这是因为其能够最大化可用算力及内存带宽。下图展示了80亿参数的Meta Lama 3模型在AWS m7i.metal-48x实例上的推理性能,该实例基于第四代英特尔至强可扩展处理器。

雷蛇xbox手柄评测

mate40pro碎屏险499

清华大学出国留学名单

AWS实例上Llama 3的下一个Token延迟

英特尔至强6128

不仅如此,英特尔还首次披露了即将发布的产品——英特尔至强6性能核处理器(代号为Granite Rapids)针对Meta Llama 3的性能测试。结果显示,与第四代至强处理器相比,英特尔至强6处理器在80亿参数的Llama 3推理模型的延迟降低了2倍,并且能够以低于100毫秒的token延迟,在单个双路服务器上运行诸如700亿参数的Llama 3这种更大参数的推理模型。

三大运营商5g信号覆盖率

基于英特尔至强 6性能核处理器(代号Granite Rapids)的Llama 3下一个Token延迟

考虑到Llama 3具备更高效的编码语言标记器(Tokenizer),测试采用了随机选择的prompt对Llama 3和Llama 2进行快速比较。在prompt相同的情况下,Llama 3所标记的token数量相较Llama 2减少18%。因此,即使80亿参数的Llama 3模型比70亿参数的Llama 2模型参数更高,在AWS m7i.metal-48xl实例上运行BF16推理时,整体prompt的推理时延几乎相同(该评估中,Llama 3比Llama 2快1.04倍)。


返回网站首页

本文评论
抢不到!根本抢不到!华为Mate60销量落后,口碑却遥遥领先?_华为mate60最新官方消息
进入2023年下半年后,手机圈也热闹起来了。尤其在华为Mate60系列上线后,消费电子行业也有复苏的迹象。毫无疑问,iPhone15系列和华为Mate60系列就是当下最热门的两款手机,这种情况...
日期:10-13
微软在移动端Outlook应用中引入更多广告,且看起来像邮件
  IT之家8月23日消息,据TheVerge报道,最近几个月,微软开始在iOS和Android的Outlook移动端应用中投放更多广告。  Outlook移动应用为用户提供了两个整理收件箱的选择:一个是...
日期:09-08
移动信息技术是什么「中国移动黄宇红:信息技术的融合创新 成为主流发展趋势」
通信世界网消息(CWW)2024年,将是充满变化和挑战的一年。从大模型的蓬勃发展到传统产业的数字化转型,从科技创新的突破到产业价值的提升,业界都需要保持敏锐的洞察力和开放的思维...
日期:01-22
网易首款花式动作爽游 《超激斗梦境》6月17日停运:运营不到3年_网易手游超激斗梦境下载
快科技4月17日消息,网易动作端游《超激斗梦境》今日发布停运公告,由于游戏开发运营策略的调整,《超激斗梦境》将于2024年6月17日15时终止运营。停运计划:2024年4月17日14时:关闭...
日期:04-18
充当"国家AI研究资源",传英国拟斥资1.3亿美元采购GPU
8月21日消息, 为了在全球计算能力竞赛中迎头赶上,英国首相里希·苏纳克(Rishi Sunak)计划斥资1亿英镑(约合1.3亿美元)购买数千颗高性能人工智能芯片。据悉,英国政府官员始终在与英...
日期:09-17
小米官方网_小米官方网入口
是一家中国的电子商务平台,于2010年成立,总部位于北京。提供了小米公司旗下所有产品的购买渠道,包括智能手机、笔记本电脑、智能家居、健康手环等。目前,已经成为了国内最受欢迎...
日期:05-29
打造“六光六极”算力光网,  中国移动“九州”算力光网白皮书重磅发布
通信世界网消息(CWW)为落实国家“东数西算”战略、构建网络品质行业领先优势、彰显产业链链长担当,6月13日,中国移动在贵州省贵阳市举办“九州”算力光网发布会,携手行业合作伙伴...
日期:06-13
京东达达上市了吗「达达市值跌去50亿美元,京东系高管“救火”靠谱吗?」
查看最新行情   来源:36氪荣耀ceo赵明  作者/王晗玉  编辑 /潘心怡  从8月23日集团发布二季度财报后,至美国东部时间9月6日纳斯...
日期:09-10
i5-13600K如何成为2000元级游戏处理器!13款游戏测试告诉你E核的作用_i5 9600k核显玩游戏
一、前言:E核到底能否提升游戏性能?原本这次测试是i9-13900K首发评测的一部分,但由于时间关系,没来得及完成。在13代酷睿处理器的首发测试中(https://news.mydrivers.com/1/866/8...
日期:11-11
超越RTX 3060是有条件的 Intel显卡喜新厌旧:要看平台、游戏
Intel在9月底正式发布了Arc A770及A750系列显卡,这是Arc品牌下的旗舰级显卡,算上A380、A310及A580等,代号炼金术师”的GPU家族布局算是完成了。售价方面,A750 8GB显卡售价289元,A...
日期:10-16
你支持吗!代表建议建立大学生网络游戏防沉迷机制:玩物丧志_大学生在防沉迷网络游戏应该承担怎样的责任和义务?
快科技3月4日消息,据国内媒体报道称,代表建议建立大学生网络游戏防沉迷机制,如果不加以管控可能会玩物丧志。大学生沉迷网络游戏引起全国人大代表、研祥高科技控股集团董事局主...
日期:03-04
微软2019第三财季营收及净利润均超预期「微软2023财年第三季度财报超预期」
微软公布2023财年第三季度财报,总营收为528.57亿美元,同比增长7%,净利润为182.99亿美元,同比增长9%。两项数据均超出分析师预期,导致盘后交易中股价上涨超过5%。微软2023财年第三...
日期:04-26
李炜:《跨行业跨领域工业互联网平台发展八大成效》发布
通信世界网消息(CWW)工业互联网平台下连万物、上接应用,是海量数据汇聚的枢纽,是实现数据贯通、要素汇聚、价值创造的关键载体,是实现“用数据说话、用数据决策、用数据管理”的...
日期:08-21
因红海危机,特斯拉柏林工厂大部分生产将中断两周_特斯拉柏林工厂即将动工,航拍画面暴露工厂规模
1月12日消息,特斯拉周四宣布,柏林超级工厂将在1月29日至2月11日期间暂停大部分汽车生产工作,因为红海船只遇袭事件导致运输路线改变,零部件供应短缺。近期,也门胡塞武装在红海频...
日期:01-12
南方小土豆到北方跳了一天的雪 南方小土豆是什么梗
越来越多南方人选择前往北方体验冰雪运动。这些南方小土豆们在北方的雪地上尽情玩耍,体验滑雪、雪橇等各种冰雪项目,带来了不同地域间的文化交流和互动。这样的冰雪之旅不仅推...
日期:01-03
索尼爱立信:今年推出Android智能机将升至4.0(索尼爱立信智能手机)
  索尼爱立信日前证实,其所有在2011年推出的Android智能手机都将升级至Andoid 4.0版本(Ice Cream Sandwich,冰淇淋三明治)。Android 4.0是谷歌上周发布的最新版操作系统,将...
日期:07-24
河南轮岗两年后 小米王腾回北京 卢伟冰:回总部就要准备打大仗
快科技8月26日消息,2021年11月,时任Redmi产品总监的王腾宣布,不再负责产品相关的工作,轮岗到河南分公司任职,担任小米河南分公司总经理一职。没想到,本周二还在河南省科技馆新馆参...
日期:08-26
Anthropic 计划创建的「Claude-Next」前沿大模型将比目前最先进的 AI 强大 10 倍
4月7日消息:据 TechCrunch 报道,Anthropic 是谷歌支持的初创公司,他们计划创建一个名为「Claude-Next」的前沿大模型,其能力将比目前最先进的 AI 强大 10 倍。然而,这需要在未来...
日期:04-07
微软12大竞争对手:非传统软件商成主要威胁_微软竞争者
  微软有很多竞争对手,以至于很难确定哪个竞争对手令微软CEO史蒂夫·鲍尔默(Steve Ballmer)夜不能寐。在凭借Windows和Office统治消费和企业软件领域的同时,微软还希望在数据...
日期:07-26