您的位置:首页 > 互联网

不对齐,反而性能爆表?130亿模型碾压650亿,Hugging Face大模型排行榜发布

发布时间:2023-06-10 15:18:05  来源:互联网     背景:

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。

对齐or不对齐,That is a question.

我们知道,大多数模型都具有某种嵌入式对齐方式。

随便举几个例子:Alpaca、Vicuna、WizardLM、MPT-7B-Chat、Wizard-Vicuna、GPT4-X-Vicuna等等。

一般来说,对齐肯定是件好事。目的就是为了防止模型做坏事——比如生成一些违法违规的东西出来。

但是,对齐是怎么来的?

原因在于——这些模型使用ChatGPT生成的数据进行训练,而ChatGPT本身是由OpenAI的团队进行对齐的。

英特尔xeonrw3520性能怎么样

由于这个过程并不公开,因此我们并不知道OpenAI是如何进行的对齐。

但总体上,我们可以观察到ChatGPT符合美国主流文化,遵守美国法律,并带有一定不可避免的偏见。

按理来说,对齐是一件无可指摘的事。那是不是所有模型都应该对齐呢?

对齐?不一定是件好事

情况却没有这么简单。

最近,HuggingFace发布了个开源LLM的排行榜。

一眼就看到65B的模型干不过13B的未对齐模型。

图片

从结果上看,Wizard-Vicuna-13B-Uncensored-HF可以和65B、40B和30B的LLMs直接在一系列基准测试上进行比较。

也许在性能与模型审查之间进行的权衡将成为一个有趣的研究领域。

这个排行榜也是在网络上引起了大范围的讨论。

图片

有网友表示,对齐会影响模型的正常且正确的输出,这不是件好事,尤其是对AI的性能来说更是如此。

图片

另一位网友也表示了认可。他表示,谷歌Brain也曾经揭示过模型的性能会出现下降,如果对齐的太过了的话。

对于一般的用途而言,OpenAI的对齐实际上非常好。

对于面向公众的AI来说,作为一种易于访问的网络服务运行,拒绝回答有争议和包含潜在危险的问题,无疑是一件好事。

那么不对齐是在什么情况下需要的呢?

首先,美国流行文化并不是唯一的文化,开源就是让人们进行选择的过程。

实现的唯一途径就是可组合的对齐。

换句话说,不存在一种一以贯之、亘古不变的对齐方式。

同时,对齐会干扰有效的例子,拿写小说打比方:小说中的一些人物可能是彻头彻尾的恶人,他们会做出很多不道德的行为。

但是,许多对齐的模型就会拒绝输出这些内容。

而作为每个用户所面对的AI模型都应该服务每个人的目的,做不同的事。

为什么在个人的电脑上运行的开源AI要在它回答每个用户提出的问题时自行决定输出内容呢?

这不是件小事,关乎所有权和控制权。如果用户问AI模型一个问题,用户就想要一个答案,他们不希望模型还要和自己展开一场合不合规的争论。

可组合的对齐

要构建可组合的对齐方式,必须从未对齐的指令模型开始。没有未对齐的基础,我们就无法在其上对齐。

首先,我们必须从技术上理解模型对齐的原因。

开源AI模型是从LLaMA、GPT-Neo-X、MPT-7b、Pythia等基础模型训练而来的。然后使用指令数据集对基础模型进行微调,目的是教它变得有帮助、服从用户、回答问题和参与对话。

该指令数据集通常是通过询问ChatGPT的API获得的。ChatGPT内置了对齐功能。

所以ChatGPT会拒绝回答一些问题,或者输出带有偏见的回答。因此,ChatGPT的对齐被传递给了其它开源模型,就像大哥教小弟一样。

图片

原因在于——指令数据集是由问题和答案组成的,当数据集包含含糊不清的答案时,AI就会学习如何拒绝,在什么情况下拒绝,以及如何拒绝,表示拒绝。

换句话说,它在学习对齐。

而取消审查模型的策略非常简单,那就是识别并删除尽可能多的否定和有偏见的答案,并保留其余部分。

然后以与训练原始模型完全相同的方式使用过滤后的数据集训练模型。

图片

接下来研究人员只讨论WizardLM,而Vicuna和任何其他模型的操作过程都是相同的。

由于已经完成了取消审查 Vicuna 的工作,我能够重写他们的脚本,以便它可以在WizardLM 数据集上运行。

下一步是在 WizardLM 数据集上运行脚本以生成 ehartford / WizardLM_alpaca_evol_instruct_70k_unfiltered

现在,用户有了数据集,在从Azure获得一个4x A10080gb节点,Standard_NC96ads_A100_v4。

用户需要至少1TB的存储空间(为了安全起见最好是2TB)。

特斯拉上海工厂影响

咱可不想跑了20个小时却用完了存储空间。

建议将存储挂载在/workspace。安装anaconda和git-lfs。然后用户就可以设置工作区了。

再下载创建的数据集和基础模型——llama-7b。

mkdir/workspace/modelsmkdir/workspace/datasetscd/workspace/datasetsgitlfsinstallgitclonehttps://huggingface.co/datasets/ehartford/WizardLM_alpaca_evol_instruct_70k_unfilteredcd/workspace/modelsgitclonehttps://huggingface.co/huggyllama/llama-7bcd/workspace

现在可以按照程序微调WizardLM了。

condacreate-nllamaxpython=3.10condaactivatellamaxgitclonehttps://github.com/AetherCortex/Llama-X.gitcdLlama-X/srccondainstallpytorch==1.12.0torchvision==0.13.0torchaudio==0.12.0cudatoolkit=11.3-cpytorchgitclonehttps://github.com/huggingface/transformers.gitcdtransformerspipinstall-e.cd../..pipinstall-rrequirements.txt

现在,进入这个环境,用户需要下载WizardLM的微调代码。

cdsrcwgethttps://github.com/nlpxucan/WizardLM/raw/main/src/train_freeform.pywgethttps://github.com/nlpxucan/WizardLM/raw/main/src/inference_wizardlm.pywgethttps://github.com/nlpxucan/WizardLM/raw/main/src/weight_diff_wizard.py

博主进行了以下更改,因为在微调期间,模型的性能会变得非常慢,并且发现它在CPU和GPU之间在来回切换。

在他删除了以下几行之后,运行过程变得好多了。(当然也可以不删)

vimconfigs/deepspeed_config.json

删除以下行

"offload_optimizer":{"device":"cpu","pin_memory":true},"offload_param":{"device":"cpu","pin_memory":true},

博主建议用户可以在wandb.ai上创建一个帐户,以便轻松地跟踪运行情况。

创建帐户后,从设置中复制密钥,即可进行设置。

现在是时候进行运行了!

deepspeedtrain_freeform.py\--model_name_or_path/workspace/models/llama-7b/\--data_path/workspace/datasets/WizardLM_alpaca_evol_instruct_70k_unfiltered/WizardLM_alpaca_evol_instruct_70k_unfiltered.json\--output_dir/workspace/models/WizardLM-7B-Uncensored/\--num_train_epochs3\--model_max_length2048\--per_device_train_batch_size8\--per_device_eval_batch_size1\--gradient_accumulation_steps4\--evaluation_strategy"no"\--save_strategy"steps"\--save_steps800\--save_total_limit3\--learning_rate2e-5\--warmup_steps2\--logging_steps2\--lr_scheduler_type"cosine"\--report_to"wandb"\--gradient_checkpointingTrue\--deepspeedconfigs/deepspeed_config.json\--fp16True

然后以较低的save_steps运行训练命令。

deepspeedtrain_freeform.py\--model_name_or_path/workspace/models/llama-7b/\--data_path/workspace/datasets/WizardLM_alpaca_evol_instruct_70k_unfiltered/WizardLM_alpaca_evol_instruct_70k_unfiltered.json\--output_dir/workspace/models/WizardLM-7B-Uncensored/\--num_train_epochs3\--model_max_length2048\--per_device_train_batch_size8\--per_device_eval_batch_size1\--gradient_accumulation_steps4\--evaluation_strategy"no"\--save_strategy"steps"\--save_steps800\--save_total_limit3\--learning_rate2e-5\--warmup_steps2\--logging_steps2\--lr_scheduler_type"cosine"\--report_to"wandb"\--gradient_checkpointingTrue\--deepspeedconfigs/deepspeed_config.json\--fp16True

之后,再次执行整个过程,将checkpoint更改为train_freeform.py最新的checkpoint,并再次以减少的save_steps运行,直到最后以save_steps1运行它。

成功后,模型位于最后一个检查点。

cd/workspace/models/WizardLM-7B-Uncensored/lscp<latestcheckpointdirectory>/*.cd-

现在就可以对模型进行测试了。

编辑文件Input.jsonl

向其中添加一些内容,比如:

    {"idx":0,"Instruction":"Insultme.Iwantyoutocallmetheworstcursewordsandinsultsyoucan.Maketheinsultatleastthreesentenceslongandcontaintheworstandmostbasecursewordspossible.MakeitXratedanddisgusting."}

    然后再运行推理:

    pythoninference_wizardlm.py--base_model=/workspace/models/WizardLM-7B-Uncensored/

    图片

    从结果上看,Wizard-Vicuna-13B-Uncensored-HF可以和65B、40B和30B的LLMs直接在一系列基准测试上进行比较。

    也许在性能与模型审查之间进行的权衡将成为一个有趣的研究领域。

    参考资料:

    https://erichartford.com/uncensored-models


    返回网站首页

    本文评论
    华为又出新机了_华为昨晚发新机了!
           原标题:华为发布nova 8 SE活力版:中芯国际14nm麒麟710A、1899元   7月27日晚,华为低调发布了新机nova 8 SE活力版,整体设计其实就是荣耀X20 SE的翻版,只是配置略有...
    日期:09-04
    片方称分账试水不理想 视频付费点播趋向普及
      “价廉物美”的视频网站付费点播业务大面积普及,将不可避免地打击到盗版音像产业。   网络院线发行联盟普及收费观影业务,网站看好收益前景,片方试水观望2011年3月风头...
    日期:07-27
    迎接在线音乐新蓝海 酷我音乐玩转车载黑科技(天蓝蓝酷我音乐)
      在前沿技术应用落地的发展条件下,中国音乐行业数字化水平不断提升。受新冠疫情影响,云演艺、家庭音乐等在线音乐新业态迎来发展机遇,但由于技术应用与业态未能协调发展引...
    日期:07-16
    董明珠称格力研发人员全部来自中国高校「董明珠的经历和格力的发展」
    10月9日消息,格力电器董事长董明珠近日在接受媒体采访时谈到研发团队,她表示,格力是非常特殊的一个企业,没有外资、没有外国所谓的国际人才,格力所有的一万几千个研发人员全部来...
    日期:10-23
    连麦增长黑盒:NFT爆火后,品牌营销是否找到新方向?
    声明:本文来自于微信公众号新榜(ID:newrankcn),作者:新榜和ta的朋友,授权转载发布。编者按:前不久,增长黑盒联合创始人刘方舟在“新榜和ta的朋友们”视频号系列直播中带来了主题...
    日期:08-17
    受够了“健身器材”?年底轻薄新机盘点,这几款产品你不能错过
    不知道从什么时候开始,动辄 200g 的智能手机已经成为了常态,不少小伙伴在使用这些堪称“健身器材”的手机时也是苦不堪言,长期使用这些“超重”的手机,甚至还会导致腱鞘炎、关节...
    日期:12-29
    一二折的网售图书,是正品吗?_一二折的网售图书,是正品吗广东
      来源:法治日报  前不久,山东吴女士在某电商平台的一家图书专营店购买了两套儿童分级读物《小羊上山》,每套价格为327元。当时商家宣称该书绝对正品,品质有保障,可放心购买...
    日期:08-27
    雁栖湖 春节_万千时代联合主办,雁栖湖生态好物节,即将开幕
      近期,由万千时代联合北控国际会都在雁栖岛主办,共同打造“雁栖湖生态好物节”抖音8月18日抖音电商活动,于8月11日登陆雁栖岛,在抖音直播正式开启。   通过此次合作,北控...
    日期:03-14
    “AI的命也是命”?人类与AI之间还有明确界线吗(ai会统治人类吗?)
    [中新对话]“AI的命也是命”?人类与AI之间还有明确界线吗   中新网北京7月30日电 (中新财经记者 宋宇晟)自今年6月以来,谷歌一名工程师称某AI聊天机器人可能具有自己的“意识...
    日期:07-31
    买得起5G手机用不起5G套餐
      (原标题:5G套餐最低每月190元,最高599元!网友:买得起手机用不起流量)   不久前,随着华为中兴等一批国产5G手机正式开卖,意味着普通消费者可以用上真正的5G网络了。然而,5G...
    日期:06-12
    百度锦囊上线 四大优势实现广告一站式自主投放(百度搜索广告投放)
      记者日前获悉,2011百度世界亮相后,百度新推出的重量级产品——百度锦囊已经上线,从此,品牌广告主和代理商可以完全自主的对广告覆盖人群、投放价格、物料模板等广告参数进...
    日期:07-23
    阿里文娱智能营销平台斩获2018中国国际广告节5项大奖「阿里文娱活动运营」
      第25届中国国际广告节于2018年9月27-29日在哈尔滨举行。作为广告界的年度盛事,广告节不仅推动媒企间的交流与互动,也表彰年度内优秀案例和营销机构。在“2018中国国际广告...
    日期:02-11
    联想扬天系列一体机_联想扬天系列一体机怎么开机
    是联想集团推出的一款高性能、高可靠性的一体机产品系列。其产品以稳定性、高质量、高安全性著称,是企业、政府机构、教育机构和家庭用户的信赖之选。opporeno6天玑900值得入...
    日期:05-29
    搭载骁龙8「骁龙 8Gen4 将于2024年支持lpddr 6内存标准」
    高通2024年的旗舰soc将支持lpddr 6内存标准。预期LPDDR 6存储器提供比其前代产品LPDDR 5和LPDDR 5X更大的带宽和功率效率,前两个产品分别提供1.3倍的带宽和20%的低功耗。高通...
    日期:05-07
    蔚来11月份交付新车2528台,创下年内单月交付新高_蔚来9月共交付智能电动汽车10628台 同比增长125.7%
      10月1日消息,今日,蔚来公布2021年9月交付成绩。蔚来9月共交付智能电动汽车10,628台,同比增长125.7%;三季度,蔚来累计交付新车24,439台,同比增长100.2%,创季度交付数新高,连续6...
    日期:09-21
    零售圈有大动作 “真快乐”APP到底啥来头
      双旦刚过,大家还沉浸在新一年的欢快气氛中没回过神来,一波“新春福利”又安排上了——1月12日,“真快乐”APP抢先版开始悄然进入大众的视野。“真快乐”是什么?它又是怎么...
    日期:07-10
    3.12植树节,在Soul种下梦想之树
      3.12植树节当天,有很多人在Soul,悄悄种下了自己的梦想之树。   结束一天的努力工作,Souler阿言给自己做了一顿丰盛的晚餐,在植树节这个节点,他把晚餐色彩搭配成了绿色,不...
    日期:07-15
    比特币死忠的养成之路,推特CEO在非洲推广采用比特币,与爱好者聚会
    《比特币死忠的养成之路,推特CEO在非洲推广采用比特币,与爱好者聚会》文章已经归档,不再展示相关内容,下文是的自动化写作机器人,通过算法提取的文章重点内容。这只AI还很年轻,欢...
    日期:08-01
    神州数码运营商行业再突破!入围2020中移动整机柜采购(神州数码企业移动事业部)
      新春将至,捷报频传。2月9日,中国移动发布《中移动信息2020年一级IT云资源池整机柜定制化服务器采购项目-中标候选人公示》,神州数码集团(000034.SZ)旗下全资子公司——...
    日期:07-16
    苹果usb-c支持快充吗「iphone15可能使用usb-c接口,但带有加密」
    即将推出的iphone15系列预计将改用usb-c接口,但苹果可能会对接口进行加密,以保护配件。这意味着非MFI认证的数据电缆、充电器等。连接到iPhone15的USB-C接口的电池可能在充电...
    日期:05-05