您的位置:首页 > 互联网

1.5T内存挑战英伟达!8枚芯片撑起3个GPT-4,华人AI芯片独角兽估值365亿_intel atom cpu,1.6g

发布时间:2023-09-22 23:59:02  来源:互联网     背景:

声明:本文来自于微信公众号量子位(ID:QbitAI),作者:梦晨 衡宇,授权转载发布

高端GPU持续缺货之下,一家要挑战英伟达的芯片初创公司成为行业热议焦点。

8枚芯片跑大模型,就能支持5万亿参数(GPT-4的三倍)。

这是独角兽企业SambaNova刚刚发布的新型AI芯片SN40L——

型号中40代表是他们第四代产品,L代表专为大模型(LLM)优化:高达1.5T的内存,支持25.6万个token的序列长度。

CEORodrigo Liang表示,当前行业标准做法下运行万亿参数大模型需要数百枚芯片,我们的方法使总拥有成本只有标准方法的1/25。

SambaNova目前估值50亿美元(约365亿人民币),累计完成了6轮总计11亿美元的融资,投资方包括英特尔、软银、三星、GV等。

他们不仅在芯片上要挑战英伟达,业务模式上也说要比英伟达走的更远:直接参与帮助企业训练私有大模型。

目标客户上野心更是很大:瞄准世界上最大的2000家企业。

1.5TB内存的AI芯片

最新产品SN40L,由台积电5纳米工艺制造,包含1020亿晶体管,峰值速度638TeraFLOPS。

与英伟达等其他AI芯片更大的不同在于新的三层Dataflow内存系统。

  • 520MB片上SRAM内存

  • 65GB的高带宽HBM3内存

  • 以及高达1.5TB的外部DRAM内存

与主要竞品相比,英伟达H100最高拥有80GB HBM3内存,AMD MI300拥有192GB HBM3内存。

SN40L的高带宽HBM3内存实际比前两者小,更多依靠大容量DRAM。

Rodrigo Liang表示,虽然DRAM速度更慢,但专用的软件编译器可以智能地分配三个内存层之间的负载,还允许编译器将8个芯片视为单个系统。

517天猫吃货节主题

除了硬件指标,SN40L针对大模型做的优化还有同时提供密集和稀疏计算加速。

华为手表watch 2微信怎么用

他们认为大模型中许多权重设置为0,像其他数据一样去执行操作很浪费。

他们找到一种软件层面的加速办法,与调度和数据传输有关,但没有透露细节,“我们还没准备好向公布是如何做到这一点的”。

咨询机构Gartner的分析师Chirag Dekate认为,SN40L的一个可能优势在于多模态AI。

intel atom cpu,1.6g

GPU的架构非常严格,面对图像、视频、文本等多样数据时可能不够灵活,而SambaNova可以调整硬件来满足工作负载的要求。

目前,SambaNova的芯片和系统已获得不少大型客户,包括世界排名前列的超算实验室,日本富岳、美国阿贡国家实验室、劳伦斯国家实验室,以及咨询公司埃森哲等。

业务模式也比较特别,芯片不单卖,而是出售其定制技术堆栈,从芯片到服务器系统,甚至包括部署大模型。

为此,他们与TogetherML联合开发了BloomChat,一个1760亿参数的多语言聊天大模型。

BloomChat建立在BigScience组织的开源大模型Bloom之上,并在来自OpenChatKit、Dolly2.0和OASST1的OIG上进行了微调。

训练过程中,它使用了SambaNova独特的可重配置数据流架构,然后在SambaNova DataScale系统进行训练。

这也是这家公司最大被投资者热捧之外的最大争议点之一,很多人不看好一家公司既做芯片又做大模型。

给每家大企业打造150个大模型

在与The Next Platform网站交流时,CEO Rodrigo Liang表示:

用于大模型训练的公开数据已快耗尽,但对参数数量的追求还在不断增加。

各种大模型的性能相差只有几个百分点,这不是大家应该玩的游戏。

他认为大模型与生成式AI商业化的下一个战场是企业的私有数据,尤其是大企业。

这些企业坐拥大量的数据,但自己不知道其中大部分内容是什么。

intel atom cpu,1.6g

对于企业私有大模型的形态,SambaNova也有与众不同的观点。

他们认为最终企业内部不会运行一个GPT-4或谷歌Gemini那样的超大模型,而是根据不同数据子集创建150个独特的模型,聚合参数超过万亿。

相当于把GPT-4等大模型内部的Mixture of Experts(专家混合)架构扩展到整个系统,称为Composition of Experts(专家合成)。

在企业运转的每个节点运行一个完整且经过专门调整的基础模型,分别用法律语料库、制造语料库、风险管理语料库、财富管理语料库、客户销售语料库、客户支持语料库等等不同数据训练。

这些专家模型之间通过一种软件路由或负载平衡器联在一起,收到推理请求后决定具体向哪个模型推送提示词。

这一策略与GPT-4和谷歌Gemini等做法形成鲜明对比,巨头大多希望创建一个能泛化到数百万个任务的巨型模型。

分析师认为技术上可能谷歌的做法性能更强,但SambaNova的方法对企业来说更实用。

没有任何一个模型或人能完整访问企业的所有数据,限制每个部门能访问的专家模型,就能限制他们能访问的数据。

斯坦福系芯片公司,华人工程师主力

SambaNova成立于2017年,2020年之前都比较低调。

联创3人都是斯坦福背景,连产品系列名Cardinal(深红色)都是斯坦福的昵称与代表颜色。

CEO Rodrigo Liang是前Sun/甲骨文工程副总裁,也有人将这个名字解读为暗指甲骨文老对头IBM的DeepBlue(深蓝)。

CTOKunle Olukotun是电气工程教授,因多核芯片架构方面的研究而闻名,开发了首批支持线程级推测 (TLS) 的芯片之一。

Christopher Ré是计算机科学副教授,重点研究方向机器学习和数据分析的速度和可扩展性。

此外团队中还有不少华人工程师。

从官网公开信息来看,SambaNova的领导团队中,至少有3名华人。

Jonathan Chang,拥有UC伯克利的机械工程学士学位以及南加州大学的MBA学位。

他在构建高增长方面拥有20多年的经验。加入SambaNova之前,Chang在特斯拉工作了近9年。

Marshall Choy,此前曾担任甲骨文公司系统产品管理和解决方案开发副总裁,监督了数十个行业的企业硬件和软件产品的上市。

Penny Li,在EDA工具和微处理器设计方面拥有超过27年的经验。此前,她曾在IBM和甲骨文工作过。

如果去领英搜索还能发现更多华人团队成员。

目前SambaNova包含SN40L芯片的人工智能引擎已上市,但定价没有公开。

根据Rodrigo Liang的说法,8个SN40L组成的集群总共可处理5万亿参数,相当于70个700亿参数大模型。

全球2000强的企业只需购买两个这样的8芯片集群,就能满足所有大模型需求。

参考链接:

[1]https://spectrum.ieee.org/ai-chip-sambanova

[2]https://www.nextplatform.com/2023/09/20/sambanova-tackles-generative-ai-with-new-chip-and-new-approach/

[3]https://sambanova.ai/resources/


返回网站首页

本文评论
oppo k1 zol「OPPO K11曝光 官方:拥有旗舰影像体验」
7月17日 消息:近日,OPPO中国区总裁刘波对外公开了OPPO K11手机的预热信息。5寸软盘还有用吗他表示,OPPO K11将致力于为5亿大众用户打造一部好手机,让2000元左右的消费者也能够...
日期:07-17
ASML正式回应 荷兰新规所有DUV光刻机都禁止出口?
7月1日消息,昨天有消息称,ASML旗下所有的DUV光刻机,出口都要被经过认可才可以。对于这样的说法,也是引起了热议,不过ASML给出了回应。ASML表示,出口管制条例只涉及部分最新DUV型号...
日期:09-22
YY2019年度盛典携手“沪上阿姨” 为粉丝调制专属“老铁味”奶茶
  1月11日,YY直播宣布与现煮五谷茶先行者“沪上阿姨”达成YY2019年度盛典的跨界合作,为参加年度盛典的粉丝提供大量的专属调制的“老铁味”奶茶。同时,YY直播还向粉丝们发起...
日期:01-25
陌陌:2023年Q1净营收28.189亿元「陌陌2018年q2净利润8.94亿人民币 连续14个季度盈利」
6月6日 消息:6月6日,挚文集团(Nasdaq: MOMO)公布了2023年第一季度未经审计的财务业绩。财报显示,2023年第一季度,挚文集团净营收达28.189亿元(约4.105亿美元),不按照美国通用会计...
日期:06-06
博客平台WordPress.com去年新增博客超过600万个(wordpress个人主页)
  北京时间1月11日消息,博客平台WordPress.com去年新增博客超过600万个,博客页面浏览量超过230亿次,同比增长53%。   此外,用户共上传了94.5TB的照片和视频,同比增长一倍以...
日期:07-25
游客为拍照不听劝阻喂狐狸吃面包 无视劝阻!会危害动物「狐狸吃饭吗」
提醒大家,在野外或者动物园,一定不要擅自投喂小动物。据报道,近日新疆阿勒泰的景女士就在自驾游路上看见了这样的行为,有一位女游客为了拍照,不停的拿面包投喂小狐狸,不听旁人劝阻...
日期:03-14
土豆网向美国证券交易委员会SEC提交的最新招股书_美国证券交易委员会(SEC)
  8月4日上午消息,土豆网今日凌晨向美国证券交易委员会SEC提交的最新招股书披露,土豆网CEO王微在上市时将出售43万股ADR(美国存托凭证),按照土豆网发行区间28-30美元的中间价...
日期:07-22
新华三防火墙型号_新华三全系列防火墙获得国内首家EAL4增强级(最高级)认证
  近日,紫光旗下新华三集团全系列防火墙凭借其高稳定、高性能、高安全、高可信、高可控等特点,顺利通过信息产业信息安全测评中心检测与评估、中国网络安全审查技术与认证...
日期:05-09
吴世春:年轻人不要躺平,你做的每件事都在改变身边人和钱的走向
凤凰网科技讯 8月24日,凤凰网科技《浪潮》对话梅花创投吴世春,吴世春表示,你身边这种愿意支持赞助你的人,看到你的All in,看到你的破釜沉舟,才愿意跟着你一起下注。RTX 3060 Ti Mi...
日期:08-25
直播带货末班车,小红书们还赶得上吗_直播带货现在做晚不晚
错失直播带货红利期的互联网新贵,正在纷纷加快脚步,试图赶上末班车。3月初,小红书进行组织架构调整,将直播从二级部门的一个业务组上调为独立部门,统一管理直播内容和直播电商等...
日期:03-16
三星 Galaxy 全球发布会汇总:两款折叠屏更轻薄,还有耳机和手表「三星折叠手机一代」
ate怎么读在三星官方放出的 8 月 10 日 Galaxy 全球发布会的前瞻宣传图中,「天生优越」这几个字在网友中间引起了不小的讨论。发布会前,预计在此次发布会面世的新品的情报不能...
日期:09-16
正在“绑架”儿童经济,音视频会员
互联网经济中,都道是在线视频、音频的生意不好做,可当面向儿童群体,这个钱可能好赚得多。近日,喜马拉雅被家长骂上热搜。一位家长在给即将上小学的儿子配小天才手表时,发现自己给...
日期:09-17
开年爆剧《狂飙》收官在即,戏外盘活了哪些流量爆款_什么是爆款剧
声明:本文来自于微信公众号新榜(ID:newrankcn),作者:小八hachiko,授权转载发布。“咖啡不用冲,迟早会成功”“读孙子兵法,品强哥人生”“2023目标先去菜市场租个摊位卖鱼”开播半...
日期:02-01
视灯白皮书:视频号与小程序互联互通,打造商业新基建
  导语   2021年8月4日,视灯研究院正式发布《2021年上半年视频号发展白皮书》,本白皮书由视灯数据提供视频号大数据分析,综合对视频号生态代表从业者的访谈形成。据白皮书...
日期:07-17
通用汽车将向 Lithium Americas 投资 6.5 亿美元,共同开发锂矿
IT之家 2 月 1 日消息,据华尔街日报报道,通用汽车公司将向 Lithium Americas 投资 6.5 亿美元(当前约 43.94 亿元人民币),并将在内华达州共同开发一个大型锂矿。华硕灵珑II松鼠ai...
日期:02-01
特斯拉大幅下调model y售价「国产特斯拉 Model Y 后轮驱动版涨价 2000 元,起售价 26.19 万元」
IT之家 2 月 10 日消息,在 1 月 6 日宣布Model 3 与 Model Y 在中国市场全系降价后,国产特斯拉 Model Y 今日再次迎来售价调整,ModelY 后轮驱动版由 25.99 万元涨至 26.19 万元...
日期:02-13
用Shark鲨客蒸汽拖把杀菌除螨,轻松体验家居清洁乐趣(Shark鲨客蒸汽拖把)
  很早就被各大博主种草了各式各样的蒸汽拖把,一直担心拖地有水渍、拖不干净、质感太廉价等等,直到这阵子活动入手了鲨客蒸汽拖把P8,不仅是蒸汽拖把,还是一个多功能的蒸...
日期:07-14
AMD显卡驱动罕见Bug:Windows都给搞崩了「amd最新显卡驱动bug」
一个多月前就有用户反馈,在升级AMD Adrenalin 23.2.1版显卡驱动后,Windows系统都崩溃了。权威硬件检测工具CapFrameX的作者也发出警告,小心安装AMD新驱动,最好提前备份数据,以防...
日期:03-05
携号转网对营业厅的影响_携号转网被批:如果运营商故意设置套路 折损自身形象
  携号转网已经开始试运行,然而这项“福利”并没有想象中那么美好,不少用户在办理携号转网时会遭遇各种各种的“困难”。   11月20日消息,有媒体刊文批评携号转网,不是想转...
日期:08-08
sk electronic「SK 电讯组建连接亚洲、欧洲和中东的「全球电信人工智能联盟」」
7月28日消息:日前 SK 电讯在首尔 Walkerhill 酒店举行了「全球电信 AI 联盟 CEO 峰会」,来自欧洲、中东和亚洲领先全球电信公司的关键高管参加了此次峰会。SK 电讯和其他全球...
日期:07-28