您的位置:首页 > 互联网

小模型卷起来了:Mistral联合英伟达开源12B小模型,128k上下文_英伟达开发版

发布时间:2024-07-21 11:11:51  来源:互联网     背景:

声明:本文来自于微信公众号 机器之心(ID:almosthuman2014),作者:机器之心,授权转载发布。

小模型,正在成为 AI 巨头的新战场。

今天凌晨,OpenAI 突然发布了 GPT-4o 的迷你版本 ——GPT-4o mini。这个模型替代了原来的 GPT-3.5,作为免费模型在 ChatGPT 上提供。其 API 价格也非常美丽,每百万输入 token 仅为15美分,每百万输出 token60美分, 比之前的 SOTA 模型便宜一个数量级,比 OpenAI 此前最便宜的 GPT-3.5Turbo 还要便宜60% 以上。

炸苹果怎么炸视频

苹果发布会2022下半年新品ipad

OpenAI CEO 山姆・奥特曼对此的形容是:通往智能的成本已经too cheap to meter。

与动辄上千亿参数的大模型相比,小模型的优势是显而易见的:它们不仅计算成本更低,训练和部署也更为便捷,可以满足计算资源受限、数据安全级别较高的各类场景。因此,在大笔投入大模型训练之余,像 OpenAI、谷歌等科技巨头也在积极训练好用的小模型。

其实,比 OpenAI 官宣 GPT-4o mini 早几个小时,被誉为欧洲版 OpenAI的 Mistral AI 也官宣了一个小模型 ——Mistral NeMo。

这个小模型由 Mistral AI 和英伟达联合打造,参数量为120亿(12B),上下文窗口为128k。

Mistral AI 表示,Mistral NeMo 的推理能力、世界知识和编码准确性在同类产品中都是 SOTA 级别的。由于 Mistral NeMo 依赖于标准架构,因此易于使用,可在任何使用 Mistral7B 的系统中成为替代品。

下表比较了 Mistral NeMo 基本模型与两个最新的开源预训练模型(Gemma29B 和 Llama38B)的准确性。(严格来讲,这个对比不太公平,毕竟Mistral NeMo 的参数量比另外两个都要大不少)

表1:Mistral NeMo 基本模型与 Gemma29B 和 Llama38B 的性能比较。

他们在Apache2.0许可证下发布了预训练的基本检查点和指令微调检查点,允许商用。Mistral NeMo 经过量化感知训练,可在不损失任何性能的情况下进行 FP8推理。

面向大众的多语言模型

该模型专为全球多语言应用而设计。它受过函数调用训练,拥有一个大型上下文窗口,在英语、法语、德语、西班牙语、意大利语、葡萄牙语、中文、日语、韩语、阿拉伯语和印地语方面表现尤为突出。

图1:Mistral NeMo 在多语言基准测试中的表现。

Tekken:更高效的分词器

南京lg汽车零部件有限公司怎么样

Mistral NeMo 使用基于 Tiktoken 的新分词器 Tekken,该分词器经过100多种语言的训练,能比以前 Mistral 模型中使用的 SentencePiece 分词器更有效地压缩自然语言文本和源代码。在压缩源代码、中文、意大利文、法文、德文、西班牙文和俄文时,它的效率要高出约30%。在压缩韩文和阿拉伯文时,它的效率是原来的2倍和3倍。事实证明,与 Llama3分词器相比,Tekken 在压缩所有语言中约85% 的文本方面更胜一筹。

图2:Tekken 的压缩率。

指令微调

2020年4月即将推出的手机

Mistral NeMO 经历了高级微调和对齐阶段。与 Mistral7B 相比,它在遵循精确指令、推理、处理多轮对话和生成代码方面的能力大大提升。

表2:Mistral NeMo 指令微调模型的准确率。使用 GPT4o 作为裁判进行的评估。

Mistral NeMo 基础模型和指令微调模型的权重都托管在 HuggingFace 上。

  • 基础模型:https://huggingface.co/mistralai/Mistral-Nemo-Base-2407

  • 指令微调模型:https://huggingface.co/mistralai/Mistral-Nemo-Instruct-2407

你现在就可以使用 mistral-inference 试用 Mistral NeMo,并使用 mistral-finetune 对其进行调整。

该模型被还打包在一个容器中,作为 NVIDIA NIM inference 微服务,可从 ai.nvidia.com 获取。

模型变小之后,小公司也能用 AI 赚钱了

在接受 Venturebeat 采访时,英伟达应用深度学习研究副总裁 Bryan Catanzaro 详细阐述了小型模型的优势。他说:小型模型更容易获取和运行,可以有不同的商业模式,因为人们可以在家中自己的系统上运行它们。事实上,Mistral NeMo 可以在许多人已经拥有的 RTX GPU 上运行。

这一进展发生在 AI 行业的关键时刻。虽然很多注意力都集中在拥有数千亿参数的庞大模型上,但人们对能够在本地商业硬件上运行的更高效模型越来越感兴趣。这种转变是由对数据隐私的担忧、对更低延迟的需求以及对更具成本效益的 AI 解决方案的渴望所驱动的。

Mistral-NeMo128k 的上下文窗口是一个突出的功能,允许模型处理和理解比许多竞争对手更多的文本块。Catanzaro 说:我们认为长上下文能力对许多应用来说可能很重要。如果无需进行微调,那模型会更容易部署。

英伟达k1开发板

这种扩展的上下文窗口对于处理冗长文档、复杂分析或复杂编码任务的企业来说尤其有价值。它有可能消除频繁上下文刷新的需要,从而产生更加连贯一致的输出。

英伟达开发版

该模型的效率和本地部署能力可能会吸引在联网受限或有严格数据隐私要求的环境中运营的企业。然而,Catanzaro 澄清了该模型的预期使用场景。他说:我会更多地考虑笔记本电脑和台式电脑,而不是智能手机。

英伟达开发板

这一定位表明,虽然 Mistral-NeMo 使 AI 更接近个人业务用户,但它还没有达到移动部署的水平。

行业分析师认为,这次发布可能会显著扰乱 AI 软件市场。Mistral-NeMo 的推出代表了企业 AI 部署的潜在转变。通过提供一种可以在本地硬件上高效运行的模型,英伟达和 Mistral AI 正在解决阻碍许多企业广泛采用 AI 的担忧,如数据隐私、延迟以及与基于云的解决方案相关的高成本。

这一举措可能会使竞争环境更加公平,允许资源有限的小型企业利用以前只有拥有大量 IT 预算的大型公司才能获得的 AI 能力。然而,这一发展的真实影响将取决于模型在实际应用中的表现以及围绕它构建的工具和支持生态系统。

随着各行业的企业继续努力将 AI 整合到他们的运营中,像 Mistral-NeMo 这样的模型代表了向更高效、可部署的 AI 解决方案的转变。这是否会挑战更大、基于云的模型的主导地位还有待观察,但它无疑为 AI 在企业环境中的整合开辟了新的可能性。

参考链接:https://mistral.ai/news/mistral-nemo/

https://venturebeat.com/ai/nvidia-and-mistrals-new-model-mistral-nemo-brings-enterprise-grade-ai-to-desktop-computers/


返回网站首页

本文评论
腾讯的一款音游「产品将搭载腾讯游戏语音GVoice技术-传音与腾讯官宣合作」
6月7日消息,据传音官方介绍,近日传音研发中心与腾讯游戏语音GVoice在上海传音研创园签署了技术创新合作协议,双方将在移动语音技术领域展开深入合作。据悉,腾讯游戏语音GVoice是...
日期:06-07
三大音乐APP对比,音效与音质谁更胜一筹(音乐app音效哪个好)
  伴随互联网的广泛普及与应用,使用流媒体音乐平台听歌已融入大众的日常,市面上也涌现出花样繁多的听歌软件供君挑选。至于选择哪款软件,人们常常在意“量”——曲库的丰...
日期:02-16
日本芯片技术「日本将为美国公司的芯片生产提供3.2亿美元补贴」
日本贸易部长周五表示,日本将向一家美国大型芯片制造商提供高达466亿日元(3.22亿美元)的补贴以支持其在广岛工厂生产先进内存芯片的计划。由于日本和美国在扩大关键材料的制造...
日期:10-02
又一款令人惊艳的AI绘图产品来了 Visual Electric图片质量可媲美Adobe Firefly
12月11日 消息:Visual Electric是一个为创意过程打造的图像生成器,它拥有一个令人惊叹的图像库和相应的提示,可以激发灵感。它可以通过迭代来发展创意,尝试不同的风格和颜色。...
日期:12-11
京东推出平价疫苗 九价HPV疫苗三针低至3954元:现货不限量_京东上面买的九价疫苗是真的吗
11月2日消息,京东健康11.11推出平价疫苗!九价HPV疫苗三针低至3954元!现货不限量!活动日期11月1日-3日,还有三针安心服务、超时赔付服务。vivox20王者荣耀限量版手机活动城市包括:...
日期:11-02
Q1中国云服务头部市场阵营再变,华为云携手恒驰全面开启生态伙伴计划
  2020年6月24日14:00-16:30,华为云将联合上海恒驰信息系统有限公司,在上海斯格威铂尔曼酒店共同启动“恒驰&华为云生态伙伴计划”,助力企业把握云时代发展机遇,赋能华为云伙伴...
日期:07-14
搭载华为ADS 2.0高阶智能驾驶!问界新M7单日大定突破2700台:再创新高
快科技9月17日消息,AITO汽车官方宣布,问界新M7单日大定突破2700台,再创新高。昨天问界新M7单日大定突破2000台,仅用了两天时间,AITO汽车就销售了快5000台问界新M7,人气火爆。售价...
日期:09-18
超越吴京!沈腾马丽成中国票房最高男女主演_豆瓣 沈腾马丽
快科技3月24日消息,据灯塔专业版,电影《飞驰人生2》正在热映,助力演员沈腾主演电影票房超334.99亿元。快递小哥为五毛钱痛哭至此,沈腾超越吴京,成为中国影史主演电影票房最高男演...
日期:03-24
联想指纹识别软件_联想指纹识别软件下载
是一款使用于联想电脑的指纹识别软件,可以帮助用户进行身份认证和加密文件操作。下面将对该软件进行更详细的介绍和分析。首先,是一种基于生物特征识别技术的应用软件。它通过...
日期:06-03
英国学校教师们对人工智能飞速发展对教育的影响感到困惑「人工智能给学校教育的影响」
5月22日消息:英国的校长们警告称,人工智能(AI)的飞速发展及其对教育的影响让英国的学校感到困惑。在一封致《泰晤士报》的信中,来自公立和私立学校的教育工作者表示,这些发展「令...
日期:05-22
波音警告:因零部件质量问题 737 Max产量和交付量短期内将减少_波音故障率
4月14日消息,美国当地时间周四,飞机制造商波音公司警告称,由于供应商提供的零部件存在质量问题,短期内将影响737 Max的产量和交付量。中国能制造手机吗波音表示,其供应商Spirit A...
日期:04-14
天玑900处理器天梯图「天玑9300性能旗舰第一,全大核CPU抗压表现堪称顶级」
近日,联发科天玑 9300 以其出色的性能和能效表现,凭借其“全大核”架构,在手机市场上引起了热烈反响。经过CPU、GPU、APU测试以及主流游戏实测,其旗舰级别的表现得到了广泛认可...
日期:11-30
chat coin「月入过万只需用ChatGPT建个网站?AI创业博主在线教学」
声明:本文来自于微信公众号 量子位(ID:QbitAI),作者:克雷西,授权转载发布。疫情下载百度app华为手机mate 50价格靠着AI创建的网站,就能月入过万?而且……自从网站建好后就再也没碰...
日期:01-21
与携程合作的租车公司「携程租车和腾讯出行服务正式达成合作」
9 月 28 日消息,近日,携程租车和腾讯出行服务正式达成合作,携程租车正式入驻腾讯出行服务,为腾讯出行服务的用户提供一站式在线预订国内租车服务。自 9 月 20 日起,用户通过“微...
日期:09-29
iPhone 15发布会很热闹!卢伟冰:还有更热闹的Redmi Note 13_iphoneios15发布会
快科技7月14日消息,在苹果发布iPhone 15系列之后,手机圈几乎所有目光都集中到了iPhone 15上,很是热闹。小米集团卢伟冰发微博表示,Redmi Note 13系列发布会更热闹。有网友给卢伟...
日期:09-14
百度智能云千帆推出大模型普惠计划了吗「百度智能云千帆推出大模型普惠计划」
通信世界网消息(CWW)近日,据可靠消息,百度智能云千帆推出大模型普惠计划,即日起为新注册企业用户提供0元调用、0元训练、0元迁移等服务。辣椒为什么会呛嗓子抖音管理员怎么设置自...
日期:06-26
千万不要长期喝奶茶引热议:一杯就可能糖分过量 易致肥胖
你多久会在外面奶茶店买一杯奶茶喝?平安壹账链5月25日消息,今日,一则千万不要长期喝奶茶”的话题登上微博热搜第一,引起很多爱喝奶茶的网友关注。据央视网官微,有些奶茶中的奶其...
日期:05-25
小米13竟然还有超大杯:背部全是开孔
小米系列手机都会保留一个超大杯的传统,也就是传说中的Ultra,而最新的小米12S Ultra也是通过旗舰的影像技术获得了非常好的口碑,可以说是性能和影像两个都是非常重要的指标都做...
日期:12-07
千帆saas「百度将在3月21日举行千帆产品发布会 公布AppBuilder等进展」
3月5日 消息:百度智能云宣布将于3月21日在北京举办千帆产品发布会,将揭晓千帆ModelBuilder和AppBuilder的最新产品进展,分享如何助力企业、用户释放模型创新潜能,简单高效打造A...
日期:03-06
连续28个交易日!腾讯年内已斥资近200亿港元回购创新高_腾讯回购股份
腾讯 新华社 资料图   今年以来,腾讯持续回购自身股份的动作,引发市场关注。;索尼z4日版  9月28日,腾讯控股(0700.HK)在港交所发布公告,于9月28日回购127万股,回...
日期:09-30