您的位置:首页 > 互联网

开源版OpenAI再出神作,小模型吊打Llama 3!Ministral系列问世,边缘AI革命开启

发布时间:2024-10-23 14:00:48  来源:互联网     背景:

声明:本文来自于微信公众号新智元,作者:新智元,授权转载发布。

【新智元导读】Mistral7B诞生一周年之际,法国AI初创公司Mistral再次连发两个轻量级模型Ministral3B和Ministral8B,性能赶超Llama38B。

Mistral7B仅仅发布一周年,法国AI初创小模型les Ministraux就打败它了。

它堪称是,世界上最好的边缘模型。

Ministral3B和Ministral8B这两款轻量级模型,专为边缘设备打造。

截至目前,它们正式加入Mixtral、Pixtral、Codestral、Mathstral行列,成为Mistral一员。

别看仅有30亿参数,在指令跟随基准上,完全超越了Llama38B,以及前辈模型Mistral7B。

而且Ministral3B和Ministral8B在大模型竞技场中的测试,均拿下了媲美Gemma2、Llama3.1开源模型的成绩。

世界上最好的边缘模型

Ministral3B和Ministral8B都支持高达128k上下文(目前在vLLM上为32k)。

在知识、常识、推理、函数调用、效率等方面,为低于10B参数模型设立了新标杆。

而且,Ministral8B还有配备了滑动窗口注意机制(sliding-window attention),以实现更快和内存高效的推理。

不论是管理复杂的AI智能体工作流,还是创建专门的任务助手,它们均可以被微调到各种用例中。

赶超开源模型,击败Mistral7B

研究人员在多项基准测试中,评估了Les Minimrau的性能。

其中包括知识与常识、代码、数学、多语言四大方面。

预训练模型

如下图所示,与Gema22B、Llama3.23B相比较,Minstral3B在以上基准上,取得了最优成绩。

在与Llama3.18B、Mistral7B相比较过程中,仅有代码能力,Minstral8B还有些差距,其余放方面均是性能最高的模型。

如下是,更加直观可视化柱状图,Minstral8B在各项评测中,占据首位。

指令模型

再来看微调后的指令模型,性能比较的结果。

在大模型竞技场中,Minstral3B在不同基准上,实现了最优。Minstral8B仅在Wild bench上,略逊于Gema29B。

另外,在代码、数学、函数调用方面,两款新模型性能大幅超越其余模型。

下图,可以直观看出指令微调后的Minstral3B比更大的Mistral7B的改进。

如下是指令微调后的Minstral8B模型,与其他模型的性能对比直观图。

边缘计算皆可用,0.1美金百万token

如今,大模型在实际落地中,不如小模型来的更切实际。

越来越多的用户,希望对关键应用程序能够进行本地优先推理,比如设备上翻译、不用联网智能助理,自动机器人等等。

灵动科技forwardx

正如官博所述,Les Minimraux正为这些场景,提供了高计算效率、低延迟的解决方案。

当与Mistral Large等更大的模型结合使用时,les Ministraux还可以作为多步智能体工作流中,进行函数调用的高效中介。

通过微调,它们能以极低的延迟和成本基于用户意图,跨多个上下文处理输入解析、任务路由和调用API。

价格

根据官方公布的价格所示,Minstral8B输入输出价格为百万token,0.1美元。Minstral3B则为百万token0.04美元。

开源版OpenAI,不再Open

自去年成立以来,Mistral曾以磁力链方式开源了多款媲美OpenAI的模型,一路走红得到AI社区的认可。

这家总部位于巴黎的Mistral,由Meta、谷歌DeepMind前员工创立。

几个月前,它以60亿美金估值,完成6.4亿美元新一轮融资,并随之推出了一款GPT-4级别的模型——Mistral Large2。

此外,他们在今年,还推出了一个专家混合模型Mixtral8x22B。

它包含了一个编码模型Codestral,以及一个数学推理和科学发现的模型。

不过,今年这家明星公司陷入了巨大争议,因为它变得不再那么open。

年初,有消息爆料称,微软宣布将收购Mistral一些股份,并对其投资,意味着它的模型将在Azure AI进行托管。

甚至,还有Reddit网友发现,Mistral已从官网中,移除了致力于开源的承诺。

在一些模型的调用上,Mistral也开启了收费模式,包括这次同样如此。

有网友就此吐槽,不是开源的。

微博营销的预期效果

要知道,对于一家初创公司来说,一直坚持开源代码是一个巨大的挑战。

就比如反面教材Stability AI,完全放弃了开源的商业模式,也转向了收费策略。

对于Mistral也是如此,若要持续打造优秀的模型,只有这一种选择。

参考资料:

https://x.com/dchaplot/status/1846575384718172448

联想thinkbook拆机评测

https://x.com/GuillaumeLample/status/1846566817650679966


返回网站首页

本文评论
魅族销量统计2020「魅族618卖爆了!官方商城销量达去年同期378%」
中关村在线消息:近日,魅族官方呈上618终极战报,宣布其销售额增速喜人,获得以下优异成绩:苹果用户隐私事件魅族商城:魅族旗舰机型销量达成去年同期 378%;京东:魅族 618 全周期销售额...
日期:07-03
支持语音及涂鸦 Android版手机QQ2.0试用_手机qq自动涂鸦软件下载
  手机QQ(Android)2.0正式版是腾讯公司基于Android系统特性推出的全新架构的手机QQ软件,与之前的Android版手机QQ不会互相覆盖。新版手机QQ2.0支持换肤、涂鸦、语音和视频...
日期:07-23
微软测试 Win10 Chromium/Edge 新功能: CPU 性能优化、滚动新效果(microsoft edge chromium)
  7月6日消息 外媒Windows Latest报道,今年早些时候,微软将Edge浏览器切换为Chromium开源引擎,后者也为Google Chrome、Brave和其他浏览器提供支持。   微软正在与竞争对...
日期:07-14
乘联会:1月中国汽车经销商库存预警指数61.8% 市场需求走低_乘联会官网7月汽车销量
2月2日消息,乘联会最新数据显示,2023年1月中国汽车经销商库存预警指数为61.8%,同比上升3.5个百分点,环比上升3.6个百分点。乘联会表示,库存预警指数位于荣枯线之上,汽车流通行业处...
日期:02-03
新钉钉拍照可以生成小程序_钉钉 拍照
  讯; 4月18日上午消息,钉钉展示了内测的AI进展,在钉钉输入斜杠“/”即可唤起智能服务。过去开发小程序需要写代码,现在只要画个表拍张照,就能生成一个表单小程序。除此以外,钉...
日期:04-18
两米长的大蛇「2米长蛇闯进公司大厅吓跑员工:科普如何自救」
近日,在江苏南京,一条长达2米的巨蛇突然闯入某公司大厅,吓得员工们四散奔逃,当地民警迅速赶到,成功将蛇捉住。当时,员工们正在工作,突然听到大厅传来异响,一看竟然是一条大蛇在游动,...
日期:07-03
高通:8核CPU对智能手机是上限了
在主流桌面市场,AMD、Intel已经将核心数堆到16核、24核等高度,但是手机领域,似乎并不热衷于堆核。对此,凤凰科技报道称,高通表示,八核心对于智能手机来说是一个上限。iPhone 12 pr...
日期:11-25
丰田卡罗拉Altis灵活燃料混合动力车将在印度上路测试
丰田公司的卡罗拉Altis混合动力车将在印度作为乙醇动力车的技术示范车,作为其在印度测试灵活燃料汽车的试点项目。该车也以乙醇为燃料,由印度道路运输和公路部长Nitin Gadkari...
日期:10-17
多地春晚彩排现科目三 网友:心死了 该来的还是来了
1月16日,多地2024年春晚的彩排花絮在网络上流传开来。其中,一众演员在舞台上跳起了神曲《科目三》的舞蹈,引发了网友的热议。有网友表示,“该来的还是来了”,而另一部分网友则调...
日期:01-17
一起拼更省钱 国美618好友拼购Day好物来袭
  ​众人拾柴火焰高,两人拼团更省钱!日前,国美618拼购Day活动上线,每日推出多款精选商品,并给予高力度的折扣优惠,前提是两人团购。好的价格怎能不与好友分享,两人购买同...
日期:07-14
我国自主研制航空发动机主轴承新突破!疲劳寿命超5万小时_我国航空发动机轴承现状
11月3日,据央视新闻消息,近日,由北京航空材料研究院实施的航空发动机关键构件抗疲劳寿命试验突破5万小时,标志着我国高端装备制造技术取得全新突破。摩托罗拉千元机网红轻食加盟...
日期:11-12
全球米价上涨「国际米价涨至11年高位 联合国:2030年将有6亿人长期食物不足」
7月30日消息,最近几个月,多个国际机构纷纷预测全球可能出现极端和破坏性天气。目前厄尔尼诺现象威胁到主要水稻生产国的产量,全球大米价格已经徘徊在11年来的高点附近。从过去...
日期:07-30
山姆圈中产,俞敏洪偷师_山姆老师专栏
出品|虎嗅商业消费组万亿元大市场作者|黄青春题图|视觉中国一则雪球爆料再次将东方甄选拽到了舆论中心。10 月 12 日,雪球用户爆料称,东方甄选于 10 月 11 日向员工开放 App 付费...
日期:10-15
百度正式开启2023“好运中国年”活动 推出多种AIGC玩法_2021年百度集好运活动
1月11日 消息:百度2023“好运中国年”活动日前正式启动,除了“集好运”等活动外,还融合了百度AI数字人度晓晓、百度AIGC能力(人工智能自动生成内容)及飞桨文心大模型,推出了“兔...
日期:01-11
马斯克旗下AI创企xAI发布首款人工智能聊天机器人Grok_马斯克ai连接人脑
11月6日消息,据外媒报道,特斯拉CEO埃隆·马斯克(Elon Musk)旗下人工智能初创公司xAI发布了首款生成式人工智能聊天机器人——Grok。上周,马斯克警告称,人工智能是“对人类最大的威...
日期:11-06
公众号阅读量200能挣钱吗「公众号阅读数暴跌!2023年怎么做自媒体赚钱?独家干货!」
声明:本文来自于微信公众号 运营公举小磊磊(ID:gongjulei),作者:运营公举小磊磊,授权转载发布。一个没有争议的事实,公众号越来越难做了。尤其是订阅号,阅读数,转发数都断崖式下滑...
日期:02-08
IBM 推出 watsonx 代码助手:助力企业开发者提升编码效率和准确性
10 月 27 日消息:IBM 今天推出了 watsonx Code Assistant,这是一个借助生成式人工智能技术,通过自然语言提示帮助企业开发者和 IT 运营人员更快、更准确地编码的助手。五款利...
日期:10-27
中国翼龙系列无人机_我国自研翼龙-1E 无人机首飞成功:全面对标美国同级产品
  1 月 21 日消息,今日航空工业宣布,1 月 18 日,中航无人机自主研制的“翼龙”系列翼龙-1E 无人机顺利完成首飞。这款无人机具有大翼展的特点,体型纤细,头部有着“翼龙”标志...
日期:07-17
商用笔记本成交额同比增长100% 京东3C数码企业及商采618开门红28小时战报来袭
自31日晚8点京东618全面开启,各条战线捷报频传,京东3C数码企业及商采也迎来了开门红!截至6月1日24点,超300个3C数码品牌在京东企业客户成交额同比增长超100%。同时,电脑终端、影...
日期:06-03
达观“曹植”大模型、优刻得AIGC算力底座亮相2023WAIC
通信世界网消息(CWW)7月7日,在2023世界人工智能大会(WAIC)期间,由上海市浦东新区青年联合会、优刻得、达观数据联合主办“AI生成与垂直大语言模型的无限魅力”主题论坛线上线下同...
日期:07-07