您的位置:首页 > 互联网

英伟达的镰刀,不是AI芯片_英伟达 刀法

发布时间:2023-10-15 13:58:26  来源:互联网     背景:

图片来源@视觉中国

华为发布P60系列

文 | 硅基研究室,作者 | 白嘉嘉

又一次被推上了风口浪尖,这次不是因为它扶摇直上的业绩,而是过去将它捧在手心的、OpenAI、谷歌等人工智能排头兵起了异心。

据The Information报道,计划在下个月的年度开发者大会上推出首款为人工智能设计的芯片。这款芯片是为训练和运行大型语言模型(LLM)的数据中心服务器设计的。OpenAI也在探索制造自己的人工智能芯片。公开信息显示,OpenAI至少投资了3家芯片公司。

谷歌的自研芯片TPU更是迭代到了v5世代。此前有分析师爆料谷歌的算力资源比OpenAI、Meta、、和CoreWeave加起来还要多,它的优势正是来源于拥有庞大数量的TPU。

这些企业为什么要下场造芯,市场上已经有了许多分析,原因主要集中在的GPU价格过高、产能不足。通过自研芯片,有望削弱在人工智能芯片领域的定价权,同时比没有自研芯片的企业更具战略自主。

但是,自研芯片真的能迫使放缓手中的镰刀吗?

一个事实是,市面上H100 GPU已涨到了原价的两倍,依旧供不应求。即便是自研芯片已经上线的谷歌,仍在大量采购的芯片。

为什么?

由于的GPU销量过于亮眼,以至于常常被简单定义成一家硬件公司。但很多人不知道的是,的软件工程师数量比硬件工程师还要多。

这句话背后的意思是,英伟达真正的护城河从不来自于层出不穷的新芯片(当然这也很了不起),而来源于软硬件生态。

而CUDA,正是这条护城河的第一道河堤。

01 英伟达真正的王牌——CUDA

2019年,CEO黄仁勋在密尔沃基工学院介绍企业发展史时,说了这样一段话。

“一项接着一项的应用,一个接着一个的科学领域,从分子动力学、计算物理学,到天体物理学、粒子物理学、高能物理学,这些不同的科学领域开始采用我们的科技,因为这是向前发展的最佳解法。而我们深深地以这项贡献为荣。”

这项英伟达深以为荣的技术,正是CUDA。

CUDA是一种推出的并行计算架构,正是在它的加持下,GPU才得以打败CPU,成为今天运行大数据计算的基础。运行相同任务的情况下,支持CUDA系统的GPU比CPU的速度要快10到100倍。

为什么CUDA有这种魔力?

CPU和GPU都是计算机处理器,都能执行计算任务,其不同点在于,CPU更擅长线性计算,而GPU更擅长并行计算。业内常用的一个类比是,CPU就像一位大学教授,能独立解决各种复杂问题,但要按部就班进行,GPU像一群小学生,单核运算能力不如CPU,但胜在核的数量庞大,能同时计算。

而CUDA,则是调动这群小学生的指挥棒。在CUDA的中介下,研究员、编程人员得以实现通过编程语言与硬件设施对话,从而将复杂的数学问题转化为多个简单的小问题,分发给GPU的多个计算核。

如黄仁勋所说,CUDA问世后成为了“科学向前发展的最佳解法”,庞大的运算能力成为了搭建超级计算机的首选。

10月11日,部下属橡树岭国家实验室宣布,他们研发出的超级计算机“顶点”(Summit),浮点运算速度峰值可达每秒20亿亿次,接近“神威·太湖之光”超级计算机的两倍。

这台算力巨兽身上搭载了近28000块GPU。而橡树岭国家实验室,正是第一家大量采用CUDA+GPU套餐的研究所。

事实上,从2006年推出CUDA至今,涉及计算机计算的各个领域,几乎已经被塑造成了的形状。航空航天、生物科学研究、机械和流体模拟及能源探索等领域的研究,80%在CUDA的基础上进行。

并且,在大模型热的带动下,CUDA生态合作者规模仍在翻倍增长。

根据2023财年年报,目前有400万名开发者正在与CUDA合作。通过12年的时间达到200万名开发者,在过去的两年半里该数字翻了一番,目前CUDA的下载量已经超过了4000万次。

与此同时,仍在不断扩大CUDA生态,推出了软件加速库的集合CUDA-X AI。这些库建立在 CUDA之上,提供对于深度学习、机器学习和高性能计算必不可少的优化功能,是针对数据科学加速的端到端平台。

CUDA生态如日中天,与之相辅相成的GPU成为消费者的首选,因此赚得盆满钵满。不过,面对这么大一块蛋糕,竞争对手自然不可能只眼铮铮地看着。

比如,AMD推出了生态平台ROCm,同样兼容不少计算框架;OpenAI的Triton被认为是CUDA的最有力挑战者;由设计,后交由Khronos Group维护的开源构架OpenCL,借鉴了CUDA的成功经验,并尽可能的支持多核CPU、GPU或其他加速器;谷歌用TPU+TensorFlow+云的模式吸引开发者和拓展客户。

但这些理论上的竞争者,在实际工作中,却暴露出了各种各样的问题。

今年2月,半导体研究和咨询公司Semi Analysis首席分析师Dylan Patel曾写了一篇名为《Nvidia 在机器学习领域的 CUDA 垄断如何被打破(How Nvidia’s CUDA Monopoly In Machine Learning Is Breaking - OpenAI Triton And PyTorch 2.0)》的文章。

美团一日游

小米十二期免息

文章的留言中,一位程序员表示:

“我希望如此,但我非常非常怀疑。我使用的所有东西都是基于CUDA构建的。实际上,在非NVidia硬件上没有任何功能。‘实际上有效’与‘理论上有效’不同。我使用的很多东西理论上都支持 ROCm,但在实践中,当你尝试使用它时,你会遇到大大小小的错误,并且会崩溃或无法正常工作。”

一线研究人员的言论证明了,在软硬件均坐稳头把交椅,并且培育了市场近20年的英伟达面前,至少眼下这个阶段,没有企业能和它正面竞争。

02 英伟达帝国,诞生于再造世界

为什么恰好是捏住了CUDA这张王牌?从2006年CUDA面世起算,已经过去了接近18年时间,为什么在如此漫长的时间里,的护城河不但没有被攻破,反而越来越宽阔?

这些问题背后都有一个默认的前提——CUDA是那个正确的方向。而在英伟达孤注一掷的21世纪初,这句话黄仁勋对股东和市场重复了千百遍。

如果我们想要一个美好的世界,要做的第一件事,就是模拟它。某种程度上,这个想法就是GPU时代的原点,将那些复杂的物理定律模拟出来,并以画面的形式呈现。然而,那些模拟物理定律的应用不会从天上掉下来,它需要有人一个一个地去开发。

因此,即便GPU的运算能力已经被证明未来有可能超过CPU,应用程序匮乏,编程过程太过繁琐,缺少底层语言代表的现状,仍让程序员们对其敬而远之。

2003年,推出了4核CPU,为了与之竞争,开始着手发展统一计算设备架构技术,也就是CUDA。

英伟达刀法精湛

这个想法由首席科学家大卫·柯克博士提出,后来也是他说服黄仁勋,让英伟达未来所有的GPU都必须支持CUDA。因为柯克在计算机高性能计算领域所发挥的重要作用,他后来被誉为CUDA之父,还当选为美国国家工程院院士。

这些荣誉都是后话,当时黄仁勋需要解决的问题是,如何让股东接受产品成本需要上升一倍,去搏一个回报周期可能在10年以上的未来。

事实上,围绕着CUDA的质疑一直持续到了AI时代的前夜,的市值常年徘徊在10亿美元的水平,股价甚至一度因为CUDA附加成本对业绩的拖累跌至1.5美元。股东多次提出希望他们专注于提高盈利能力。

2010年,当时的CPU王者曾传出计划收购。《芯片战争》中描述到,“对来说,(收购)价格不是问题,问题是该给黄仁勋一个什么职位。然而双方一直没有达成一致意见,最后不了了之。”

在市场看空英伟达的这些年里,黄仁勋从未质疑过CUDA的价值。

为了吸引开发人员编写应用程序并展示GPU的优势,黄仁勋先是使用了当时已经拥有庞大游戏玩家市场的 GeForce GPU来作为安装CUDA的基础。然后又创建了一个名为GTC的会议,在全球范围内孜孜不倦地推广CUDA。

近年来最为市场称道的一个案例是,2016年,黄仁勋亲自去彼时刚成立的OpenAI交流,并赠送了一台搭载有8颗P100芯片的DGX-1,那是英伟达当时最强力的浮点运算GPU。

这件事往往被解读为黄仁勋的眼光老辣,但对他本人来说,这无非是确保CUDA成为前沿科学研究者最习惯的框架的又一次尝试而已。

与的笃定恰好能形成对比的,是。

作为CPU时代的王者,本该成为最具竞争力的对手。

然而,在2010年取消了CPU和GPU融合的独立显卡计划后,英特尔就失去了和英伟达硬碰硬的兴趣(当然也可以说是因为纳米制程陷入停滞而失去底气)。先是试图收购,然后又转身去和在移动基带市场上较劲,2015年第一波人工智能热潮席卷而来时,大梦初醒的一手收购人工智能方向的芯片公司,一手将AMD的芯片纳入到自己的系统芯片当中。

可惜的是,彼时的市场份额超过了60%,CUDA垄断已然初具雏形,在GPU领域,已经没有资格和坐在同一张牌桌上了。

03 DPU和DOCA,英伟达的新战场

2020年,创投圈曾流行过一个笑话。

“DPU是什么?”

“支付宝到账,一亿元。”

只要触发了DPU这个关键词,钱就会滚滚而来。

这轮DPU热,正是掀起的。

2020年上半年,以69亿美元对价收购以色列网络芯片公司Mellanox Technologies,并于同年推出BlueField-2 DPU,将其定义为继CPU、GPU之后的第三颗主力芯片。

那么到底什么是DPU?

DPU最核心的功能,是取代CPU,建立以数据为中心的计算架构。

众所周知,CPU的全称是中央处理器,它除了承担运行应用程序、执行计算的任务外,还扮演着数据流量控制器的角色,在GPU、存储、FPGA和其他设备之间移动数据。

你可以简单理解成,校长抛出一道难题后,老师(CPU)对其进行拆分,其中较为复杂的部分由自己解决,容易但繁琐的分发给学生(GPU)来做。过去题的数量比较少,老师还可以分得过来。但随着题目的数量增加,拆分、分发题目的时间反倒占用了老师的大量时间。

港股股价腾讯

此时,再聘请一个专门拆分、分发题目的人,就成为了提升系统整体运算效率的关键。而DPU就是那个人。

近年来,随着数据中心建设、网络带宽和数据量急剧增长,同时CPU性能增长速度放缓,越来越难以适应未来计算芯片的需求,DPU应运而生。英伟达官网是这样定义它的——DPU是一个用于数据中心基础设施的先进计算平台。

英伟达刀法精湛

就像GPU背后有CUDA生态作支撑一样,黄仁勋同样为DPU量身定做了一套软件生态,同步推出了DOCA。

借助DOCA,开发者可以通过创建软件定义、云原生、DPU 加速的服务来对未来的数据中心基础设施进行编程,并支持零信任保护,以满足现代数据中心日益增长的性能和安全需求。

与CUDA不同的是,已经功成名就的英伟达不再需要苦口婆心地向市场证明自己眼光的独到之处,创投圈的DPU热就足以说明这一点。

不过伴随而来的,DPU市场的竞争也远比当年GPU要来得激烈。

国外厂商中,Marvell、、AMD均研发了DPU或DPU的对位产品。国内亦涌现出一批DPU初创企业,如云豹智能、中科驭数、芯启源、云脉芯联、星云智联、大禹智芯。

云厂商方面,的AWS和阿里云已经实现大规模商用DPU构架,腾讯和字节跳动则加入了DPU研发大军,其中腾讯推出了水杉和银杉两代DPU。

这一次还能靠DPU+DOCA的软硬件生态复现GPU+CUDA的奇迹吗?

各国、各企业之间的算力竞赛愈演愈烈,在产能受限并且DOCA生态尚未形成的情况下,对手们并非毫无机会。


返回网站首页

本文评论
哔哩哔哩2021一季度财报_哔哩哔哩将于9月8日发布2022年第二季度财报
小米8拍照对比iphone x 查看最新行情   讯 北京时间8月18日晚间消息,在线娱乐平台哔哩哔哩(B站,Nasdaq:BILI,HKEX: 9626)今日宣布,将于美国东部时间2022年9月...
日期:08-21
AR有未来吗「苹果CEO称:未来没有AR将无法生活」
中关村在线消息:近日,苹果公司CEO蒂姆·库克公开表示,AR(增强现实)技术对人们的生活具有深远的影响,将来没有AR简直没法生活。库克表示:我对增强现实技术感到超级兴奋。我们今天坐...
日期:10-06
优信最新消息2021「优信2023财年第一季度营收6.3亿元 同比增长125%」
  讯 北京时间9月30日晚间消息,优信(Nasdaq:UXIN)今日发布了截至2022年6月30日的2023财年第一季度财报。财报显示,优信第一财季总营收为6.262亿元(约合9350万美元),较上一季度的5...
日期:10-01
华硕和华擎的部分主板已推出新BIOS,支持英特尔“下一代”处理器
早些时候,我们报道过技嘉已经为LGA 1700主板发布了新版BIOS,提供了14代酷睿也就是Raptor Lake Refresh处理器的支持。而根据Wccftech、Tom's Hardware、Videocardz的报道,另外...
日期:06-19
人民日报评论:“糖水爷爷”被网暴,莫让自持正义成为伤人武器
文 | 徐之     睡前聊一会儿,梦中有世界。听众朋友,你好。   前不久,武汉一位街边卖糖水的老人意外走红。“2元无限续杯,17年如一日”的坚守,令无数人为之感动。然而,无端的...
日期:08-17
是三翼鸟发布会!也是用户签约会「三翼鸟怎么样?」
说起品牌发布会的举办地点,最常见的当属酒店、展会现场或是体验店。那么,开在毛坯房里的发布会,您见过吗?6 月 3 日,海尔三翼鸟在杭州江照华庭小区徐先生的家里,召开了一场“别具...
日期:06-06
新病毒冒充播放器逃脱杀软监控 每天感染超10万PC
  近日,金山毒霸云安全中心发现一些伪装成播放器的病毒感染量猛增,日感染量即将突破10万台电脑,而这些电脑中毒的原因都是用户主动下载。金山毒霸工程师建议网民在杀毒软件...
日期:07-30
快充不挑充电头!iQOO 10 Pro 200W闪充首批获得融合快充功能认证_iqoopro支持120w快充吗?
今年7月份,iQOO 10系列旗舰正式发布,其中iQOO 10 Pro最大亮点之一就是200W超快闪充。三星s6拍照比s8好这也是目前行业内可量产的最高充电功率,仅需10分钟就能完全充满4700mAh电...
日期:10-01
人工智能微软小冰&惠普数字印刷跨界合作,消费者可享个性化体验(人工智能 小冰)
  说到德国德鲁巴国际印刷及纸业展览会Drupa(以下简称“德鲁巴”),印刷业的从业者一定都不陌生。德鲁巴由德国杜塞尔多夫展览有限公司举办,每四年一次,是全球最大的印刷及纸...
日期:03-05
天文学家认为,整个地球都是「天文学家发现对地球具有潜在威胁的天体:直径1.5公里」
据最新报道,一个国际团队使用智利托洛洛山美洲天文台Vctor M.Blanco 4米望远镜上安装的暗能量相机(DECam),发现了3颗隐藏在太阳强光中的近地小行星(NEA)。骑摩托走遍中国其中一颗...
日期:11-09
百度文心官网「百度登记文心大模型相关作品著作权」
5月18日 消息:企查查APP显示,近日,北京百度网讯科技有限公司登记“文心大模型形象标识”、“文心人工智能对话大模型(EB)主界面设计(PC端)”、“文心人工智能对话大模型(EB)头像...
日期:05-18
百度爱好者2011十大百度发展预测榜_百度发展潜力
百度爱好者(Baiduer.com.cn)消息,回顾完了已经过去的2010,我们看到了百度的快速发展。对于2011年百度的发展动向,笔者做了如下十大预测。 Top1:百度Mp3或将联合音乐商推动正版化...
日期:07-25
特斯拉q2销量「小鹏公布 Q2 财报,对抗特斯拉 Model Y 车型明年到」
2022 年 8 月 23 日,小鹏汽车公布 2022 年 Q2 财报,而数据显示第二季度车型的总交付量为 34422 辆,连续四个季度成为新势力销冠。营收 74.36 亿人民币,同比增长 97.7%。然而第二...
日期:09-21
360家装防火墙_一键就能换新机 360家庭防火墙这个功能超赞!
  随着智能电子设备的发展,家庭中用到无线网络的电子设备越来越多,再加上宽带升级等情况,路由器的更新频率也不断升高。可尴尬的是,多数人都记不住自己家的宽带账号密码,而这...
日期:05-03
iPhone 14 Pro立功了!苹果市值一夜暴涨超万亿元「iphone 12 pro 销量」
日前,苹果公司正式发布了2022年第三季度业绩报告。其中显示,本季度实现营收901.46亿美元,同比增长8.1%,实现净利润207.1亿美元(约合人民币1500亿元),同比微增0.83%。这一季度业绩十...
日期:10-31
微软正测试用ChatGPT控制机器人 无需用户学习编程语言
3月16日 消息:微软一直在测试使用 OpenAI 的语言模型 ChatGPT,以实现对家用和工业辅助机器人的远程控制。这些试验旨在创建一种新的、更简化的方式来实现人机交互,而无需用户...
日期:03-16
独立开发变现周刊(第92期):创建一个年收入350万美元的小工具,1000万至1500万美元出售
声明:本文来自于微信公众号 凯凯而谈(ID:web-bear),作者:凯凯刘,授权转载发布。小米RedmiBook Pro 15极米new z6参数分享独立开发、产品变现相关内容,每周五发布。目录1、Vercel...
日期:06-26
互联网汽车金融市场规模将超4400亿 京东金融升级车白条成市场新势力
  随着居民生活水平提高,人们购车意愿增强,新一代消费主力对于金融和互联网服务接受程度更高,互联网汽车金融行业将迎来快速发展期。本次iiMedia Research(艾媒咨询)发布的...
日期:01-07
抖音最新处罚借重大事件不当蹭热违规炒作违规账号101个_抖音搬运违规处罚是什么
2月6日 消息:昨日晚间,抖音发布了关于打击“借重大事件不当蹭热违规炒作”的公告。公告称,平台近日在巡查中发现,在各方关注的“胡*宇”事件中,有极个别用户发布违规信息,如账号...
日期:02-06
微软承认 Outlook 启动缓慢问题,放出临时解决方案「win10一打开outlook就停止工作」
IT之家 6 月 21 日消息,微软日前承认 Outlook 存在 BUG,会卡在开屏页面上,现在该公司放出了一个解决方法。微软表示这个 BUG 是由于启动过程中同步整个脱机数据文件 (.ost)导致,用...
日期:06-21