您的位置:首页 > 互联网

开源模型新纪录:超越Mixtral 8x7B Instruct的模型来了_开源模型训练平台

发布时间:2024-01-17 15:32:33  来源:互联网     背景:

声明:本文来自于微信公众号 机器之心(ID:almosthuman2014),作者:张倩,授权转载发布。

又有新的开源模型可以用了。

从 Llama、Llama2到 Mixtral8x7B,开源模型的性能记录一直在被刷新。由于 Mistral8x7B 在大多数基准测试中都优于 Llama270B 和 GPT-3.5,因此它也被认为是一种非常接近 GPT-4的开源选项。

如何在大厂生存

在前段时间的一篇论文中,该模型背后的公司 Mistral AI 公布了 Mixtral8x7B 的一些技术细节,并推出了 Mixtral8x7B – Instruct 聊天模型。该模型性能在人类评估基准上明显超过了 GPT-3.5Turbo、Claude-2.1、Gemini Pro 和 Llama270B 聊天模型。在 BBQ 和 BOLD 等基准中,Mixtral - Instruct 也显示出更少的偏见。

但最近,Mixtral Instruct 也被超越了。一家名叫 Nous Research 的公司宣布,他们基于 Mixtral8x7B 训练的新模型 ——Nous-Hermes-2Mixtral8x7B 在很多基准上都超过了 Mixtral Instruct,达到了 SOTA 性能。

该公司联合创始人、X 平台用户 @Teknium (e/λ) 表示,据我所知,这是第一个击败 Mixtral Instruct 的基于 Mixtral 的模型,在我个人的测试中,它可能是最好的开源 LLM 模型!

贵州刺梨产业发展论坛

开源模拟

模型资料卡显示,该模型在超过100万个条目(主要是 GPT-4生成的数据)以及来自整个 AI 领域开放数据集的其他高质量数据上进行了训练。根据后续微调方法的不同,该模型被分为两个版本:

  • 仅用 SFT 方法微调的 Nous Hermes2Mixtral8x7B SFT。链接:https://huggingface.co/NousResearch/Nous-Hermes-2-Mixtral-8x7B-SFT

  • 用 SFT+DPO 方法微调的 Nous Hermes2Mixtral8x7B DPO。链接:https://huggingface.co/NousResearch/Nous-Hermes-2-Mixtral-8x7B-DPO。Mixtral Nous-Hermes2DPO Adapter 链接:https://huggingface.co/NousResearch/Nous-Hermes-2-Mixtral-8x7B-DPO-adapter

至于为什么发布两个版本,@Teknium (e/λ) 给出了以下解释:

以下是模型的输出示例:

1、为数据可视化编写代码

2、写赛博朋克迷幻诗

3、根据输入文本创建提示

以下是一些性能数据:

1、GPT4All

2、AGI-Eval

开源mod

3、BigBench 推理测试

ipad网页可以做笔记吗

在模型发布之后不久,生成式 AI 初创公司 Together AI 就宣布了其 API 对该模型的支持。Together AI 去年11月刚完成超一亿美元的 A 论融资。在 Nous Research 训练和微调 Nous Hermes2Mixtral8x7B 模型期间,Together AI 为他们提供了算力支持。

图源:https://twitter.com/togethercompute/status/1746994443482538141

Nous Research 最初是一个志愿者项目。他们最近成功完成了520万美元的种子融资轮,此轮融资由 Distributed Global 和 OSS Capital 联合领投,同时吸引了包括 Together AI 创始人兼 CEO Vipul Ved Reddy 在内的多位知名投资者的参与。Nous 计划在2024年推出一款名为 Nous-Forge 的 AI 编排工具。

从官网介绍中可以看到,他们的产品定位是:能够连接和运行程序,获取和分析客户文档,并生成合成数据供生产使用。这些专有系统可根据客户的需求进行微调,无论其业务领域如何。通过这些新颖的算法,他们希望聚合并分析数字注意力生态系统中以往非结构化的专题数据,为客户提供隐藏的市场脉搏信息。


返回网站首页

本文评论
Redmi Note 12系列快充规格曝光:有望首发搭载210W快充_redmi note8充电器型号
熟悉小米的用户都知道,小米旗下的Redmi子品牌一直主打极致性价比,每一代机型都获得了用户非常广泛的好评。这段时间以来,有博主开始带来了该系列的迭代产品——全新的Redmi Not...
日期:10-05
IBM市值一度超过微软成全球第二大技术公司_ibm公司和微软公司
作者:天虹 【赛迪网讯】5月23日消息,据国外媒体报道,微软在80年代初上升到突出的地位,主要原因是签署了在IBM计算机中采用其操作系统的协议。微软后来成为全球最大的软件厂商。...
日期:07-28
vivo有望首发!天玑9000系迭代芯片即将登场:跑分高于骁龙8 Gen2「麒麟820和天玑900跑分」
今日消息,博主数码闲聊站爆料,联发科天玑9000系迭代芯片已被各大品牌开案测试,进度最快的是蓝厂,目前工程机跑分高于骁龙8 Gen2。小米Q2出货量由此看来,vivo有望首发联发科天玑90...
日期:10-02
出行回暖,网约车平台又舍得补贴了_网约车涨价
声明:本文来自于微信公众号新莓daybreak(ID:new-daybreak),作者:李欢,授权转载发布。假期结束,北京西站北广场网约车P1站点异常忙碌,拖着行李的人潮,排队进站的车流,需要高举喇叭身穿制...
日期:02-10
特斯拉发布2023第二季度财报 净利润为27.03亿美元「特斯拉第二季度营收超预期」
7月20日 消息:7月19日美股收盘后,特斯拉发布了2023 年第二季度财报。根据财报数据,该公司在今年第二季度的收入达到了249. 27 亿美元,同比增加了47%,超过了市场预测的245. 1 亿...
日期:07-20
荣耀X20消息不断 或将成为荣耀Magic3发布会又一惊喜(荣耀x20新品发布会)
  近日,荣耀俱乐部针对广大X系列新老用户发起了一项福利活动,用户只需分享自己的X系列手机使用体验,就将有机会获得全新的荣耀X20。继上周荣耀俱乐部众测招募令之后再添实锤...
日期:01-08
思必驰DFM-2语言大模型正式发布,多项创新技术助推产业落地!_思必驰科技股份有限公司
7 月 12 日,【东风生万物】思必驰DFM- 2 大模型及创新技术应用成果发布会在苏州成功举行。(发布会现场)在会上,思必驰董事长、CEO高始兴,联合创始人、首席科学家俞凯,分别分享了...
日期:07-13
给大模型持久记忆!GitHub 2万星向量数据库云服务升级,国内云产品7月上线
声明:本文来自于微信公众号 量子位 (ID:QbitAI),允中 发自 凹非寺 ,授权转载发布。一个在GitHub上标星超2万的数据库,究竟是什么来头?原来,这正是最近大火的向量数据库之一、首个...
日期:06-28
中国航天科技集团称与SpaceX相比大而不强、不优:永不自满、自大_中国航天和spacex
快科技12月5日消息,据中国航天科技集团官方发布的公告显示,其与SpaceX相比大而不强,所以时刻告诫自己永不自满、永不自大。中国航天科技集团在评论中指出:我们相比顶级商业航天...
日期:12-05
华为Mate 60 Pro发布后!苹果官宣2023秋季发布会定档9月13日:iPhone 15来了_华为6月2号发布会新品
快科技8月30日消息,万万没想到,在华为发布Mate 60 Pro后,苹果紧随其后官宣2023秋季发布会时间。今日凌晨,苹果正式宣布将于北京时间9月13日凌晨1点举办特别活动,并在Apple Park进...
日期:08-30
千亿电竞将于“Z世代”爆发?_电竞中国第一人
声明:本文来自于微信公众号 壁虎看KOL(ID:bihukankol),作者:江渔,授权转载发布。年轻热血的电竞行业21年秋,一则西湖边某少年手舞足蹈的视频成为抖音热门,画面中,他一边对着手机欢...
日期:10-04
男子车位被占6次打电话无果气坏:装地桩包围对方车辆_车位被占打哪个电话联系车主
6月5日消息,日常生活中,大家或许遇到过自家车位被别人使用的情况,一般情况下只要留好电话,及时开走都不会有太大的问题,但总有些自私且无赖的人,让人血压飙升,那么有什么好方法治治...
日期:06-06
google certified professional cloud architect「ChatGPT真香!谷歌顶级AI专家跳槽OpenAI」
3月31日消息,谷歌顶级人工智能研究员雅各布德弗林(Jacob Devlin)已经于今年早些时候辞职并加入竞争对手OpenAI。零跑汽车上市IPO支付宝会泄露我信息吗德弗林曾经告诉谷歌高管们...
日期:04-01
蔚来ec6高性能尾标「48.80万元起 蔚来全新EC7发布:全系标配电动升降尾翼」
12月24日晚,蔚来全新EC7正式上市,该车是蔚来第二代技术平台NT2打造的首款Coupe SUV车型,其中75kWh版售价48.8万元,100kWh版售价54.60万元;该车同样支持电池租用方案,售价41.80万元...
日期:12-25
宾得单反相机「宾得单反相机kr」
是由日本理光公司生产的一种高端数码相机品牌,专为摄影发烧友和专业摄影师推出。这款相机致力于给用户带来超凡的拍摄体验,无论是在摄影技术,还是像素和成像效果方面都做到了完...
日期:05-31
vivo蔡司影像旗舰助力 蔡司启迪未来探索者活动圆满落幕
(原标题:vivo蔡司影像旗舰助力 蔡司启迪未来探索者活动圆满落幕) 苹果ios14 carplay的变化 【2023年8月20日,上海】8月20日,蔡...
日期:08-22
idc印度智能手机出货量2018_IDC:一季度印度智能手机市场同比增长7% 小米保持冠军宝座
  [摘要]在2019年第一季度的印度市场,小米继续保持着领先地位,智能手机销量同比增长了8.1%。三星位居第二,智能手机销量同比下降了4.8%。vivo的销量翻了一番,占据了第三名的...
日期:08-17
oppo开发者模式是什么意思「OPPO MR Glass开发者版首次亮相 搭载骁龙XR2+平台」
6月1日消息,今日,OPPO在2023年增强现实世界博览会(AWE)上带来在XR领域的最新探索成果—OPPO MR Glass开发者版。OPPO认为,在不久的将来,XR(扩展现实)领域的应用将迅速增长, XR领域内...
日期:06-01
微软宣布任命资深工程师萨蒂亚纳德拉为服务器与工具业务部总裁
  2月10日消息,据国外媒体报道,为了重振云计算业务,微软今日宣布任命资深专业工程师萨蒂亚纳德拉(Satya Nadella)为服务器与工具业务部总裁。   微软首席执行官鲍尔默在一份...
日期:07-26
美国首例!密歇根州禁售香味电子烟 避免青少年成瘾
  9月4日,据外媒报道,美国密西根宣布将全面禁止带香味的电子烟,成为美国首个禁止销售带香味的州,该决定源于对青少年使用电子烟而产生呼吸疾病的担忧,此项禁电子烟法令将推行...
日期:12-07