您的位置:首页 > 互联网

1800亿参数,世界顶级开源大模型Falcon官宣!碾压LLaMA 2,性能直逼GPT-4「这些价值超百万的ai开源模型,聪明人已经都下载好了」

发布时间:2023-09-08 10:12:18  来源:互联网     背景:

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。

开源mod

索尼wf-1000xm3和wf-1000xm4对比

【新智元导读】一经发布,地表最强开源模型Falcon180B直接霸榜HF。3.5万亿token训练,性能直接碾压Llama2。

一夜之间,世界最强开源大模型Falcon180B引爆全网!

1800亿参数,Falcon在3.5万亿token完成训练,直接登顶Hugging Face排行榜。

基准测试中,Falcon180B在推理、编码、熟练度和知识测试各种任务中,一举击败Llama2。

甚至,Falcon180B能够与谷歌PaLM2不差上下,性能直逼GPT-4。

不过,英伟达高级科学家Jim Fan对此表示质疑,

- Falcon-180B的训练数据中,代码只占5%。

而代码是迄今为止对提高推理能力、掌握工具使用和增强AI智能体最有用的数据。事实上,GPT-3.5是在Codex的基础上进行微调的。

- 没有编码基准数据。

没有代码能力,就不能声称「优于GPT-3.5」或「接近GPT-4」。它本应是预训练配方中不可或缺的一部分,而不是事后的微调。

- 对于参数大于30B的语言模型,是时候采用混合专家系统(MoE)了。到目前为止,我们只看到OSS MoE LLM <10B。

蔚来电动车起火原因

一起来看看,Falcon180B究竟是什么来头?

世界最强开源大模型

此前,Falcon已经推出了三种模型大小,分别是1.3B、7.5B、40B。

官方介绍,Falcon180B是40B的升级版本,由阿布扎比的全球领先技术研究中心TII推出,可免费商用。

这次,研究人员在基底模型上技术上进行了创新,比如利用Multi-Query Attention等来提高模型的可扩展性。

对于训练过程,Falcon180B基于亚马逊云机器学习平台Amazon SageMaker,在多达4096个GPU上完成了对3.5万亿token的训练。

总GPU计算时,大约7,000,000个。

Falcon180B的参数规模是Llama2(70B)的2.5倍,而训练所需的计算量是Llama2的4倍。

具体训练数据中,Falcon180B主要是RefinedWe数据集(大约占85%) 。

此外,它还在对话、技术论文,以及一小部分代码等经过整理的混合数据的基础上进行了训练。

这个预训练数据集足够大,即使是3.5万亿个token也只占不到一个epoch。

官方自称,Falcon180B是当前「最好」的开源大模型,具体表现如下:

在MMLU基准上,Falcon180B的性能超过了Llama270B和GPT-3.5。

在HellaSwag、LAMBADA、WebQuestions、Winogrande、PIQA、ARC、BoolQ、CB、COPA、RTE、WiC、WSC 及ReCoRD上,与谷歌的PaLM2-Large不相上下。

另外,它在Hugging Face开源大模型榜单上,是当前评分最高(68.74分)的开放式大模型,超越了LlaMA2(67.35)。

Falcon180B上手可用

与此同时,研究人员还发布了聊天对话模型Falcon-180B-Chat。该模型在对话和指令数据集上进行了微调,数据集涵盖了Open-Platypus、UltraChat和Airoboros。

郑州黄河大桥堵车今天

回归方程b怎么计算

现在,每个人都可以进行demo体验。

地址:https://huggingface.co/tiiuae/falcon-180B-chat

Prompt 格式

基础模型没有Prompt格式,因为它并不是一个对话型大模型,也不是通过指令进行的训练,所以它并不会以对话形式回应。

预训练模型是微调的绝佳平台,但或许你不该直接使用。其对话模型则设有一个简单的对话模式。

    System:AddanoptionalsystemprompthereUser:ThisistheuserinputFalcon:ThisiswhatthemodelgeneratesUser:ThismightbeasecondturninputFalcon:andsoon

    Transformers

    从Transfomers4.33开始,Falcon180B可以在Hugging Face生态中使用和下载。

    确保已经登录Hugging Face账号,并安装了最新版本的transformers:

    pipinstall--upgradetransformershuggingface-clilogin

    bfloat16

    以下是如何在 bfloat16中使用基础模型的方法。Falcon180B是一个大模型,所以请注意它的硬件要求。

    对此,硬件要求如下:

    可以看出,若想对Falcon180B进行全面微调,至少需要8X8X A10080G,如果仅是推理的话,也得需要8XA10080G的GPU。

    fromtransformersimportAutoTokenizer,AutoModelForCausalLMimporttransformersimporttorchmodel_id="tiiuae/falcon-180B"tokenizer=AutoTokenizer.from_pretrained(model_id)model=AutoModelForCausalLM.from_pretrained(model_id,torch_dtype=torch.bfloat16,device_map="auto",)prompt="MynameisPedro,Ilivein"inputs=tokenizer(prompt,return_tensors="pt").to("cuda")output=model.generate(input_ids=inputs["input_ids"],attention_mask=inputs["attention_mask"],do_sample=True,temperature=0.6,top_p=0.9,max_new_tokens=50,)output=output[0].to("cpu")print(tokenizer.decode(output)

    可能会产生如下输出结果:

      MynameisPedro,IliveinPortugalandIam25yearsold.Iamagraphicdesigner,butIamalsopassionateaboutphotographyandvideo.IlovetotravelandIamalwayslookingfornewadventures.Ilovetomeetnewpeopleandexplorenewplaces.

      使用8位和4位的bitsandbytes

      此外,Falcon180B的8位和4位量化版本在评估方面与bfloat16几乎没有差别!

      开源mod

      这对推理来说是个好消息,因为用户可以放心地使用量化版本来降低硬件要求。

      注意,在8位版本进行推理要比4位版本快得多。要使用量化,你需要安装「bitsandbytes」库,并在加载模型时启用相应的标志:

        model=AutoModelForCausalLM.from_pretrained(model_id,torch_dtype=torch.bfloat16,**load_in_8bit=True,**device_map="auto",)

        对话模型

        如上所述,为跟踪对话而微调的模型版本,使用了非常直接的训练模板。我们必须遵循同样的模式才能运行聊天式推理。

        作为参考,你可以看看聊天演示中的 [format_prompt] 函数:

          defformat_prompt(message,history,system_prompt):prompt=""ifsystem_prompt:prompt+=f"System:{system_prompt}\n"foruser_prompt,bot_responseinhistory:prompt+=f"User:{user_prompt}\n"prompt+=f"Falcon:{bot_response}\n"prompt+=f"User:{message}\nFalcon:"returnprompt

          从上可见,用户的交互和模型的回应前面都有 User: 和 Falcon: 分隔符。我们将它们连接在一起,形成一个包含整个对话历史的提示。这样,就可以提供一个系统提示来调整生成风格。

          网友热评

          对于Falcon180B的真正实力,许多网友对此展开热议。

          绝对难以置信。它击败了GPT-3.5,与谷歌的PaLM-2Large不相上下。这简直改变游戏规则!

          一位创业公司的CEO表示,我测试了Falcon-180B对话机器人,它并不比Llama2-70B聊天系统好。HF OpenLLM排行榜也显示了好坏参半的结果。考虑到它的规模更大,训练集也更多,这种情况令人惊讶。

          举个栗子:

          给出一些条目,让Falcon-180B和Llama2-70B分别回答,看看效果如何?

          Falcon-180B误将马鞍算作动物。而Llama2-70B回答简洁,还给出了正确答案。

          参考资料:

          https://twitter.com/TIIuae/status/1699380904404103245

          https://twitter.com/DrJimFan/status/1699459647592403236

          https://huggingface.co/blog/zh/falcon-180b

          https://huggingface.co/tiiuae/falcon-180B


          返回网站首页

          本文评论
          你升没?中电信半年净赚183亿:千兆宽带、5G提速降费 用户激增「中国电信增持40亿」
          中国电信今天发布公告,上半年实现营收2402.19亿元,同比增长10.4%;净利润182.9亿元,同比增长3.1%;按照2022年中期净利润的60%向全体股东分配股息,每股派发0.120元。上半年移动通信...
          日期:09-27
          不一样的胎教!90后泰拳教练怀孕后适当打拳助生产「泰拳手训练视频」
          6月26日消息,山东临沂90后泰拳教练怀孕后每天对抗打拳。facebook最大的竞争对手当事人吴教练称,爱人也是一名拳手,咨询过医生说拳手运动对宝宝没太大影响,适量运动可以帮助生产...
          日期:06-27
          三星电子调整芯片业务部门多位高管 年中罕见调整或暗示面临挑战
          7月10日消息,据外媒报道,通常在年底进行高管调整的三星电子,近日调整了芯片业务部门的多位高管,有报道称他们在年中这一不寻常的调整,可能反映了他们目前在芯片业务上所面临的困...
          日期:07-11
          Soul App恢复上架,用户喜迎Soul回归(soul能找回吗)
            此前Soul下架,很多Soul用户都在询问soul什么时候能重新上架。9月10日,Soul App恢复上架App Store。8月底,Soul App陆续在各大安卓应用商店恢复上架。至此,该应用已经完成恢...
          日期:10-23
          麦当劳在印尼推出婚礼套餐服务 230美元一条龙服务「在香港麦当劳办婚礼」
          根据法国《费加罗报》网站7月6日的报道,印度尼西亚现在可以选择麦当劳提供的婚礼套餐服务,只需支付230多欧元,即可一站式搞定。据报道,这家快餐巨头如今向新婚夫妇提供包含200份...
          日期:07-10
          5G时代哪款芯片能脱颖而出?性能实测对比后有了答案_5g芯片和cpu
            2020 年 5G 换机潮到来,不少厂商都推出了 5G 手机,也让消费者对于它们所采用的芯片性能表现给予了更多的关注。那么,不同的 5G 芯片在日常使用中的表现是怎样的?我们将透...
          日期:12-18
          阿里ai虚拟模特塔玑效果图「阿里公布内容生成虚拟对话专利 可实现共情对话」
          5月19日 消息:天眼查App显示,阿里巴巴(中国)有限公司申请的“对话内容生成、虚拟对话、对话内容的数据处理方法”专利公布。乐视超级手机用户摘要显示,该申请通过构建情感关联图...
          日期:05-19
          V观财报|A股再现天价离婚!这次是卓胜微实控人之一唐壮,女方分走34亿
            中新经纬6月20日电 A股再度出现天价离婚。哈啰单车发现违规  20日盘后,卓胜微发布公告称,近日收到实际控制人之一TANG ZHUANG(唐壮)通知,其与YI GEBING(易戈兵)经友好协...
          日期:06-21
          我国科学家证实人类是由鱼进化而来 从猿到人破灭了?「人是由鱼进化而来的」
            【CNMO】40亿年前,地球被浩瀚的海洋覆盖,没有任何生命。经过数百万年的演化,生命开始出现,相信很多人都会有这样一个疑惑,地球上的人类是如何起源的呢?我们对自己的起源总处在...
          日期:10-05
          惠普星15轻薄本_惠普推出 2022 款星 15 笔记本
            惠普现已推出 2022 款星 15 笔记本电脑,首发价 4599 元。   该机搭载第十二代英特尔酷睿 i5-1240P 处理器,12 核 16 线程,主频 4.40GHz,还有 12MB 三级缓存,多线程性能提...
          日期:07-18
          机构:亚马逊AWS已部署全球一半以上的Arm服务器CPU「亚马逊aws云服务器价格」
          据外媒报道,全球最大的云计算厂商亚马逊,目前已经拥有全球一半以上的Arm服务器CPU。报道称,亚马逊是最成功的Arm服务器芯片制造商,其产品占目前部署的Arm服务器CPU的一半以上,而...
          日期:08-10
          比亚迪腾势N7充电遇到汽油车占位:使出“双枪”充电大招 结果太爽
          之前腾势N7公布双枪”充电的时候,很多网友吐槽噱头的成分大于实际意义,但真的是这样吗?苹果12处理器a14快科技7月26日消息,今日知名汽车博主@吴佩 分享了自己开腾盛N7充电遭遇油...
          日期:07-26
          钟南山去母校「钟南山与学生合照时意外被亲 怕被老伴儿误会赶紧擦掉」
          6月26日,广州医科大学2023年毕业典礼暨学位授予仪式在番禺校区举行。中国工程院院士、获得“共和国勋章”的钟南山发表了讲话。87岁的钟南山院士一开始便以一段有趣的小故事...
          日期:06-27
          钉钉新增两项隐藏功能 文字表情与快捷指令(钉钉添加表情)
            6月21日消息,钉钉最新版本新增了两项创新功能:文字表情和快捷指令,旨在提升工作中沟通的便捷性和趣味性,提升使用体验。  据了解,在钉钉内的任一聊天消息上长按,会唤起贴表...
          日期:07-18
          强迫用户接受定向广告 Meta被欧盟最高监管机构罚款4亿美元
          1月5日消息,据国外媒体报道,近日爱尔兰隐私监管机构裁定,Meta的广告和数据处理做法违反了欧盟隐私法,并强迫用户接受定向广告,因此处以其总额超过4亿美元的罚款。据悉,爱尔兰隐私...
          日期:01-05
          “最后一公里”,花钱越来越多?_减少最后一公里
          记者 刘小燕   来源:工人日报   近日,共享单车企业陆续上调用户骑行费。有专家指出,作为用户“最后一公里”的重要交通工具,一味地涨价恐怕会造成用户的流失,用户的体验始终...
          日期:08-17
          eBay宣布将裁员500人 约占员工总数4%左右「ebay的用户规模」
          2月8日消息,据外媒报道,当地时间周二, eBay宣布将裁员500人,约占其员工总数的4%。redmi手机对比据悉,在给员工的一份备忘录中,其首席执行官杰米·伊安内表示,公司在对过去几个月全...
          日期:02-10
          马斯克推特消息「马斯克:推特现金流差点变成负30亿美元,所以才疯狂降本增效」
            讯 北京时间12月22日早间消息,据报道,埃隆·马斯克(Elon Musk)透露,在他入主推特并通过大举裁员来遏制亏损之前,该公司的现金流即将变成-30亿美元。iphone12英国上市时间  ...
          日期:12-22
          博纳影业2019年营收「博纳影业第三季度净亏损1.5亿元」
          10月30日消息,今日下午,博纳影业发布2022年第三季度财报,报告显示,博纳影业第三季度营收3.03亿元,同比下降46.59%;净亏损1.5亿元,同比扩大422.45%;扣除非经常性损益后的净亏损为1.39...
          日期:11-03
          6499元起 这定价很良心?RTX 4070 Ti今天开卖:性能3倍于3090Ti
          按照NV官方公布的意思,1月5日也就是今天,RTX 4070 Ti将正式上市销售,你是不是准备好钱等买了?RTX 4070 Ti基于AD104核心,集成了358亿个晶体管,比上代旗舰核心GA102还要多,但是294.5...
          日期:01-05