您的位置:首页 > 互联网

Llama 3突然来袭!开源社区再次沸腾:GPT-4级别模型可以自由访问的时代到来

发布时间:2024-04-19 09:45:16  来源:互联网     背景:

声明:本文来自于微信公众号 量子位(ID:QbitAI),作者:克雷西 鱼羊,授权转载发布。

Llama3来了!

就在刚刚,Meta官网上新,官宣了Llama380亿和700亿参数版本。

并且推出即为开源SOTA:

Meta官方数据显示,Llama38B和70B版本在各自参数规模上超越一众对手。

8B模型在MMLU、GPQA、HumanEval等多项基准上均胜过Gemma7B和Mistral7B Instruct。

而70B模型则超越了闭源的当红炸子鸡Claude3Sonnet,和谷歌的Gemini Pro1.5打得有来有回。

一加9r系统12.1有什么新功能

Huggingface链接一出,开源社区再次沸腾。

眼尖的盲生们还第一时间发现了华点:

Meta更藏了一手4000亿参数+的Llama3版本,不逊于Claude3超大杯Opus的那种!

AI写作助手创企HyperWriteAI的CEO见此已忍不住感慨:

我们正在步入一个新世界,一个GPT-4级别的模型开源并且可以自由访问的世界。

英伟达科学家Jim Fan则认为,还在训练中的Llama3400B将成为开源大模型的分水岭,改变很多学界研究和初创公司的发展方式。

全面取得SOTA,但8k窗口

更多技术细节,Meta在博客文章中给出。

架构层面,Llama3选择了经典的仅解码(decoder-only)式Transformer架构,采用包含128K token词汇表的分词器。

训练数据上看,Llama3的训练数据规模达到了15T tokens,全部来自于公开信息,其中5%为非英文数据,涵盖30多种语言。

小米49元电池换新

Llama3的数据量比Llama2的训练数据多7倍,其中代码比Llama2多4倍。

此外,为了提高 Llama3模型的推理效率,Meta AI还采用了分组查询注意力 (GQA)机制,在8192个tokens的序列上训练模型,并使用掩码确保自注意力不会跨越文档边界。

结果,无论是8B还是70B版本,Llama3相较于近似规模的上一代Llama2,都取得了重大飞跃。

在迄今为止的8B和70B参数规模的模型中,Llama3都成为了新的SOTA模型。

在语言(MMLU)、知识(GPQA)、编程(HumanEval)、数学(GSM-8K、MATH)等能力上,Llama3几乎全面领先于同等规模的其他模型。

除了这些常规的数据集,Meta AI还评估了Llama3在现实场景中的性能,并为此研发了一套高质量的测试数据集。

这个测试集包含了1800条数据,涵盖代码、推理、写作、总结等12个关键用例,并针对开发团队保密。

结果,Llama3不仅大幅超越Llama2,也战胜了Claude3Sonnet、Mistral Medium和GPT-3.5这些知名模型。

而在AGIEval、BIG-Bench、ARC-Challenge这些更高阶、更困难的数据集上,Llama3的表现同样可圈可点。

8B版本在这些任务上超越了Mistral和Gemma,70B版本则战胜了Gemini Pro和MoE架构的Mixtral,分别斩获相应规模的SOTA。

不过美中不足的是,Llama3的上下文窗口只有8k,这与现在动辄几十上百万窗口的大模型相比,仿佛还停留在上一代(手动狗头)。

但也不必过度担忧,Matt Shumer就对此持乐观态度,他表示相信在开源社区的努力下,窗口长度很快就会扩展上去。

Llama迎来官方网页版

目前,Llama3两种参数量的基础和Instruct版本都已上线Hugging Face可供下载。

此外,微软Azure、谷歌云、亚马逊AWS、英伟达NIM等云服务平台也将陆续上线Llama3。

同时,Meta还表示Llama3会得到英特尔、英伟达、AMD、高通等多家厂商提供的硬件平台支持。

马斯克想火星建工厂

值得一提的是,此次与基础模型一同发布的,还有基于Llama3的官方Web版本,名字就叫Meta AI。

目前该平台有对话和绘画两大功能,只用对话的话无需注册登录、即开即用,使用绘画功能则需要先登录账号。

不过,目前该平台还不支持中文,也暂未上线文本上传等功能。

代码方面,该平台也能够运行一些简单的Python程序,但似乎只能输出文本,涉及到绘图这样的任务就无法运行了。

总得来看,这个网页版本还比较初级,但也不妨期待一波后面的更新。

One More Thing

一个小插曲是,其实在Meta官宣前几个小时,微软的Azure市场已经偷跑了Llama38B Instruct版本的消息。

开源模型机器学习在线平台Replicate上的Llama3价格表也被网友们第一时间扒拉了出来。

但很快,这些“小道消息”就都被404了。

好在乌龙完了,官方也没拖着,关心开源大模型的小伙伴们,可以造作起来了(doge)。

参考链接:

[1]https://ai.meta.com/blog/meta-llama-3/

[2]https://about.fb.com/news/2024/04/meta-ai-assistant-built-with-llama-3/

[3]https://huggingface.co/meta-llama/Meta-Llama-3-70B


返回网站首页

本文评论
亚马逊中国称不屏蔽一淘内容抓取 不效仿京东
  就在京东、苏宁易购封杀一淘搜索之际,B2C网站亚马逊中国总裁王汉华今日公开表态,亚马逊中国对自己货品价格充满信心,不怕购物搜索,不会屏蔽一淘内容抓取。王汉华表示,购物搜...
日期:07-24
马云指出淘宝天猫未来三个方向 并主张组织进一步扁平化「天猫未来发展会是如何」
据《晚点 LatePost》报道,5月底,阿里巴巴的创始人马云召开了一场小型的沟通会,与淘天集团各个业务的负责人进行交流。淘天集团的CEO戴珊,行业发展部的三位负责人汪海(花名:七公)、...
日期:06-20
小红书将提供百亿流量扶持时尚商家和主播_小红书靠流量赚钱吗
3月7日消息,小红书宣布推出“时尚星火计划”,将为时尚商家和主播提供百亿流量扶持,以及货盘选品、营销工具、平台服务等扶持政策,为更多时尚商家与优质主播在小红书成长提供助力...
日期:03-07
“AI寻人”成2019年度热词,李彦宏用“AI”助天下无拐
  2019年,你印象最深的“黑科技”是什么?除了大火的AI和5G,小伙伴们还知道哪些高新科技名词呢?最近,2019年百度沸点年度科技热词榜单新鲜出炉, AI、5G、区块链、机器人、VR、...
日期:07-13
瓜子二手车:降价潮冲击,燃油SUV4月成交均价降近2千创15个月来新低
4月25日消息,瓜子二手车近日发布发布《2023降价潮下二手车价格趋势报告》,截至发稿前,2023年4月份线上二手车中燃油二手车成交均价为9.39万元,环比三月份均价下跌约800元;但与近1...
日期:04-25
超越《你的名字》!新海诚《铃芽之旅》首日票房达7803万
2016年12月新海诚导演的动画电影《你的名字。》在国内上映,首日就拿下了7629.53万票房。nvidia显卡功耗排行今天,新海诚的新作《铃芽之旅》在国内上映,截止本文成稿,首日票房成...
日期:03-24
华为P60 Pro素皮版工程机流出:双拼色高级感一绝 遗憾没上市_2022年华为p60pro
快科技7月3日消息,今年3月,华为P系列旗舰——华为P60系列正式发布,通过全球独创的凝光贝母工艺,华为带来了洛可可白配色,让每一款手机都独一无二,成为该系列人气配色之一。值得一...
日期:07-03
卡萨帝壁画电视M160:是电视,也是艺术品_卡萨帝16eg
  随着装修概念的转变,越来越多人选择嵌入式家电,这在推倒传统家电装修的“思维之墙”,人们开始追求家电与家居的巧妙融合,就像中国传统建筑的榫与卯的凹凸结合,既能体现和合共...
日期:06-21
Udio官网体验入口 AI音乐创作分享社交平台使用地址_audiodown官网
Udio是一个音乐发现、创作和分享的平台。用户可以在这里发现新的音乐作品,上传自己的创作分享给他人,并与其他音乐爱好者互动交流。该平台提供免费使用,同时也有付费高级服务供...
日期:04-10
官方通报:2只恶犬撕咬2岁女童 主人被采取刑事措施
2023年10月16日8时许,在四川成都崇州市羊马街道恒大西辰绿洲小区内,发生一起烈犬咬伤2岁女童事件,受到社会广泛关注。送医检查后发现,女童唐某全身多处咬伤,右肾挫裂伤,右侧肋骨骨...
日期:10-18
abab6体验入口 MiniMax大语言模型免费在线使用地址
abab6,作为国内首个MoE大语言模型,已全面发布,代表着大语言模型发展的一个新阶段。abab6 凭借其庞大的参数规模,能够处理更加复杂的任务,同时保持高效的训练和计算性能。此外,它还...
日期:01-17
禁止芯片出口至中国?美颁布新规后,荷兰先不干了:盟友也不能忍
日前,美国再次在半导体领域采取了一系列措施,其中,美国商务部发布了2个新的临时最终规则,收紧了相关芯片对中国的出口,其中,原本被允许出口的芯片型号,也遭到了禁止。美国登月火箭...
日期:10-27
creature「Creatosaurus官网体验入口 AI创意营销平台在线使用地址」
Creatosaurus是一款AI创意营销平台,提供全方位的社交媒体营销工具。它包括图形设计编辑器、生成式AI工具包、社交媒体管理、社交收件箱和分析等功能。该平台帮助用户提高社交...
日期:01-23
港股美团跌超11%,市值跌破1万亿港元_港股美团股票行情
查看最新行情   讯 8月16日下午消息,港股美团跌超11%,报159.6港元每股,市值跌破1万亿港元。此前有市场消息称,腾讯计划出售美团的全部或大部分股权。对此,...
日期:08-19
「遥遥领先 「曝张雪峰用上华为Mate60」-Pro,必须像华为一样」
来源:中关村在线苹果自研5G芯片酷开游戏电视9月4日,知名教育博主、峰学蔚来创始人、研途考研VIP名师张雪峰在社交媒体上晒出了一张自己使用华为Mate60 Pro的照片。他表示,终于...
日期:09-05
品质电视,悦享生活:三星商城双十二年终好价提前享_三星商城售罄
三星长期深耕高端电视市场,持续推出满足用户观影、游戏、生活办公等需求的高品质产品,以技术创新为龙头提升自身竞争力,多维构筑“科技・艺术・家”,以 17 年位居全球电视市场榜...
日期:12-06
数字主权受关注:欧洲新“数据法”瞄准美国科技巨头_欧洲数字主权报告
  北京时间 2 月 28 日早间消息,据外媒报道,欧盟准备在多大程度上维护自己在数字世界的主权?这个问题的答案将对科技行业的构成,以及日渐成为全球经济活动支柱的跨境数据流...
日期:07-17
电商巨头亚马逊败走中国的分析「电商巨头亚马逊将关闭数十个仓库,增长率跌至 20 年来低」
IT之家 9 月 4 日消息,咨询公司 MWPVL 表示,在线零售巨头亚马逊正在关闭或放弃在在美国开设 42 家设施的计划,总可用空间近 2500 万平方英尺。彭博社表示,亚马逊还推迟了其他 21...
日期:09-06
小米平板6S Pro首发Wi-Fi 7:速率高达4.3Gbps_小米平板网速慢怎么解决
快科技2月22日消息,小米2024龙年首场发布会今晚正式举行,小米推出了新一代旗舰平板小米平板6S Pro。15.6 oled 4K据介绍,小米平板6S Pro支持Wi-Fi 7技术,是小米首款支持Wi-Fi 7...
日期:02-23
抖音书单号最赚钱的类型「抖音6种月入过万的书单号」
声明:本文来自于微信公众号 十里村(ID:shilipxl),作者:十里村,授权转载发布。各位村民好,我是村长。做书单号,一个月就可以赚好几万。这是大家在一些社群里看到的分享,都想去试试。...
日期:11-08