您的位置:首页 > 互联网

算力不足,小模型成AI模型发展下个方向?_模型ipo

发布时间:2024-04-24 11:42:09  来源:互联网     背景:

大模型不是AI的唯一出路,把模型做小也是本事。

这段时间,AI模型界是真的热闹,新的模型不断涌现,不管是开源还是闭源,都在刷新成绩。就在前几天,Meta就上演了一出“重夺开源铁王座”的好戏。发布了Llama38B和70B两个版本,在多项指标上都超越了此前开源的Grok-1和DBRX,成为了新的开源大模型王者。

并且Meta还透露,之后还将推出400B版本的Llama3,它的测试成绩可是在很多方面上都追上了OpenAI闭源的GPT-4,让很多人都直呼,开源版的GPT-4就要来了。尽管在参数量上来看,相比Llama2,Llama3并没有特别大的提升,但是在某些表现上,Llama3最小的8B版本都比Llama270B要好。可见,模型性能的提升,并非只有堆参数这一种做法。

ai算法和模型的区别

Llama3重回开源之王

当地时间4月18日,“真·OpenAI”——Meta跑出了目前最强的开源大模型Llama3。本次Meta共发布了两款开源的Llama38B和Llama370B模型。根据Meta的说法,这两个版本的Llama3是目前同体量下,性能最好的开源模型。并且在某些数据集上,Llama38B的性能比Llama270B还要强,要知道,这两者的参数可是相差了一个数量级。

能够做到这点,可能是因为Llama3的训练效率要高3倍,它基于超过15T token训练,这比Llama2数据集的7倍还多。在MMLU、ARC、DROP等基准测试中,Llama38B在九项测试中领先于同行,Llama370B也同样击败了Gemini1.5Pro和Claude3Sonnet。

雷军40岁实现财富自由

尽管在参数量上并没有特别大的提升,但毫无疑问,Llama3的性能已经得到了很大的进步,可以说是用相近的参数量获得了更好的性能,这可能是在算力资源短期内无法满足更大规模运算的情况下所作出的选择,但这体现了AI模型的研发并非只有堆砌参数这一条“大力出奇迹”的道路。

把大模型做小正成业内共识

实际上,在Llama3之间的两位开源王者,Grok-1和DBRX也致力于把模型做小。和以往的大模型,使用一个模型解决一切问题的方式不同,Grok-1和DBRX都采用了MoE架构(专家模型架构),在面对不同问题的时候,调用不同的小模型来解决,实现在节省算力的情况下,保证回答的质量。

模型aic

而微软也在Llama3发布后没几天,就出手截胡,展示了Phi-3系列小模型的技术报告。在这份报告中,仅3.8B参数的Phi-3-mini在多项基准测试中都超过了Llama38B,并且为了方便开源社区使用,还特意把它设计成了与Llama系列兼容的结构。更夸张的是,微软的这个模型,在手机上也能直接跑,经4bit量化后的phi-3-mini在iPhone14pro和iPhone15使用的苹果A16芯片上能够跑到每秒12token,这也就意味着,现在手机上能本地运行的最佳开源模型,已经做到了ChatGPT水平。

而除了mini杯外,微软也一并发布了小杯和中杯,7B参数的Phi-3-small和14B参数的Phi-3-medium。在技术报告中,微软也说了,去年研究团队就发现,单纯堆砌参数量并非提升模型性能的唯一路径,反而是精心设计训练的数据,尤其是利用大模型本身去生成合成数据,并配合严格过滤的高质量数据,能够让中小模型的能力大幅跃升,所以他们也说,Textbooks are all you need,教科书级别的高质量数据才是重要的。

AI模型发展正着力于摆脱限制

自英伟达乘着AI的东风,成为行业内说一不二,当之无愧的“卖铲子的人”,各家AI公司都将英伟达的GPU视为“硬通货”,以致于谁囤有更多的英伟达的GPU,谁的AI实力就强。但英伟达的GPU的交付并未能始终跟上市场的需求。

因此,很多AI公司开始另谋出路,要么找其他的GPU生产商,要么决定自己研发AI芯片。即使你囤够了英伟达的GPU,也还有其他限制,OpenAI在前段时间就被爆出,因为训练GPT-6,差点把微软的电网搞瘫痪。马斯克也曾说过,当前限制AI发展的主要因素是算力资源,但在未来,电力会成为限制AI发展的另一阻碍。

显然,如果持续“大力出奇迹”,通过堆砌参数量来实现AI性能的提升,那么以上这些问题迟早会遇到,但是如果把大模型做小,使用较小的参数量,实现同样或者更好的性能,那么将可以显著减少对算力资源的需求,进而减少对电力资源的消耗,从而让AI在有限资源的情况下,得到更好的发展。

因此,接下来,谁能在将模型做小的同时,还能实现性能的增长,也是实力的体现。

参考资料:

https://mp.weixin.qq.com/s/F9K0A_f4CFgfFyY3bf4F8g

https://mp.weixin.qq.com/s/QJC76vH9ZrynQalkh0rXhg


返回网站首页

本文评论
为辨别offer含金量,我做了个时薪计算器_怎样才算offer
声明:本文来自于微信公众号表外表里(ID:excel-ers),作者:曹宾玲,授权转载发布。提到计算机专业,大部分人第一时间会联想到“万金油专业”“大厂”和“高薪”。但在2023届计算机毕业...
日期:12-06
嗯消失的「2023年春节档后首部!《消失的她》实现工作日票房破亿」
6月25日消息,根据灯塔专业版消息,截止今天18时06分,影片《消失的她》单日票房成功破亿。网络数据包攻击摩托罗拉最早全屏手写手机值得一提的是,这是2023年春节档后,首部工作日票...
日期:06-25
Find X6 Pro细节曝光_搭载索尼IMX890+MariSilicon X芯片 天玑9200加持-OPPO
早在去年的Find X5系列上,该机就凭借极具辨识度的外观设计和极为出众的影像方面受到了不少用户的广泛好评,而随着新的一年的到来,全新一代的OPPO Find X6系列也再次吸引了外界...
日期:09-20
3.2亿商务人都在使用的名片全能王,魅力在哪里?(名片全能王官网)
  科技的不断发展,让人们更关注高效,享受一部手机即可完成娱乐、社交、支付等多种功能的便捷感受。与此同时,纸质名片逐渐被人们抛弃,电子名片成为职场商务人士“新宠”,这也...
日期:10-26
水贝珠宝工厂在哪里「水贝珠宝人的疯狂180天 有珠宝商日赚6万元」
刚刚过去的180天里,中国的珠宝市场经历了近十年来从未有过的剧烈波动,无数参与及关注者身临其境感受着这场充满变数的战术行动,尤其是眼见金价的剧变和投资者的积极行动。自年...
日期:07-17
荣耀magic2支持多少倍变焦「解决信号盲区!荣耀Magic V2搭载射频增强芯片C1:Wi-Fi速率提升200%」
快科技7月12日消息,荣耀Magic V2今晚正式登场,除了9.9毫米的纤薄机身,它还内置了荣耀自研的射频增强芯片C1,为新机的信号连接提供保障。荣耀Magic V2在天线设计升级的基础上,通过...
日期:07-13
国务院制定给力政策鼓励软件和集成电路发展(鼓励软件产业和集成电路产业发展的优惠政策)
  国务院9日通过中国政府网发布《进一步鼓励软件产业和集成电路产业发展的若干政策》(以下简称“新政”),从财税、投融资、研究开发、进出口、人才、知识产权、市场等七方面...
日期:07-26
Getty与Nvidia合作推文生图AI平台Generative AI by iStock
划重点:荣耀6x摄像头像素当贝投影仪f1和f3哪个好苹果平板锁屏密码忘了怎么解开电脑...
日期:01-09
长亭科技网络安全培训_长亭科技连续三年亮相国家网络安全宣传周
  9月16日,2019年国家网络安全宣传周在天津正式拉开帷幕,主题为“网络安全为人民,网络安全靠人民”。长亭科技作为国内新锐网络安全厂商代表,连续三年受邀参加,携“攻、防、抓...
日期:06-01
iqoo u1 屏幕「iQOO11正式预热 全球首发2K 144Hz E6 全感屏」
中关村在线消息:距离iQOO11仅有两天,通过和两天的预热,iQOO11的很多特性已经曝光,现在为大家做一个简单汇总。嫦娥五号研发过程iQOO11搭载了高通骁龙8Gen2,和上一代骁龙8相比,骁龙...
日期:12-01
消息称Meta将进行新一轮裁员:最快本周削减数千名员工「meta team」
  讯 北京时间3月7日上午消息,据报道,据知情人士透露,Facebook和Instagram母公司Meta正计划进行新一轮裁员,该公司最快将于本周裁减数千名员工。windows1020h2更新  去年11...
日期:03-07
荣耀新平板曝光:13英寸大屏 骁龙888芯片「荣耀平板参数详细参数」
今天上午,消息称荣耀新款平板已经获得认证,将很快发布。搭载高通骁龙888移动处理平台,支持66W有线快充,40W UFCS融合快充。国庆档影片票房IDC的数据显示,到2018年年底,平板电脑...
日期:05-13
吸金2千万?《黑莲花》爆红后全网下架!抖音短剧该咋做?_网络词黑莲花是什么意思
本文转载自运营公举小磊磊(公众号ID:gongjulei),免费阅读200万字新媒体运营知识,提升新媒体运营能力。11月16日,付费短剧《黑莲花上位手册》爆火,走红抖音等平台,迅速登上微博热搜...
日期:11-29
乐淘佳资讯:2020年网店转让行业分析报告(乐淘佳网店转让平台可靠吗)
  据天眼查专业版最新数据显示,目前我国共有超378万家电商相关企业。近年来,基于互联网的“商业服务业”迅速崛起,平台与服务商融合发展,服务商生态集聚化。在互联网平台...
日期:04-12
850家公司狂吸2500亿美元,谁是SPAC热潮中真正的赢家?(SPAC投机)
  作者/周永亮   编辑/郑玄   近日,美国对冲基金大鳄、潘兴广场资本管理公司创始人比尔·阿克曼发出致股东信,正式宣布将史上规模最大的SPAC清盘。   就在两年前的20...
日期:07-31
五旬女子被喊阿姨拒买单索赔2000 服务员道歉还打折:网友感慨不能理解
因为称呼不对,这导致客人不买单还要索赔。7月1日,广东广州有网友发视频称一女子因被服务员称呼了两声阿姨,生气拒绝买单,并向店家索赔2000元。2日,店家回应此事表示:派出所来后让...
日期:07-03
芒果超媒:芒果TV已与小鹏汽车等车企展开会员领域相关合作_芒果汽车节目
证券时报e公司讯,芒果超媒(300413)在互动平台表示,芒果TV已与小鹏汽车等车企展开会员领域相关合作,共同探索车载屏视频娱乐服务。广泛携手智能汽车平台是芒果TV会员权益服务的...
日期:08-20
支付宝小荷包升级:最多支持60人同时使用「支付宝小荷包升级:最多支持60人同时使用吗」
支付宝宣布,支付宝小荷包扩容”,现在起,集体经费模式”可支持60人同时使用,还能提前预存、灵活分摊、自动计算成员结余,事后多退少补,账单一目了然。该功能适合团建、班费、聚餐费...
日期:10-02
“蔡元培”考北大研究生 复试成绩出炉:依旧是第一_蔡元培北大任职时间
快科技3月27日消息,北京大学国际关系学院近日公布了2024年硕士(内地学生)复试公示名单”,引起了广泛关注。其中,排在第一名的考生姓名竟然是蔡元培”,与北大第14任校长同名同姓,这...
日期:03-27
杭州法华寺月薪8万招聘和尚?传授72绝技?假的_杭州法华寺方丈简介
2月7日,一则所谓法华寺招聘和尚”的消息在网上流传,号称方丈住持津贴为每月8万元以上,不过经证实这是虚假信息。据悉,法华寺位于杭州市西湖区北高峰下,是一处佛教活动场所。firef...
日期:02-08