您的位置:首页 > 互联网

Nvidia 和 Mistral AI 的超精确小语言模型适用于笔记本电脑和 PC

发布时间:2024-08-24 15:21:50  来源:互联网     背景:

8月24日消息:Nvidia 和 Mistral AI 发布了一款新型的小型语言模型,据称该模型在小体积下依然具有最先进的准确性。该模型名为 Mistral-NemMo-Minitron 8B,是 NeMo 12B 的迷你版本,参数量从 120 亿缩减到了 80 亿。

华为watch3渲染图

据 Nvidia 深度学习研究副总裁 Bryan Catanzaro 在博客文章中介绍,这款 80 亿参数的小型语言模型通过两种不同的 AI 优化方法实现了规模缩减。开发团队使用了结合剪枝和蒸馏的技术。剪枝通过去除对准确性贡献最小的模型权重来缩小神经网络的规模。蒸馏过程中,团队在一个较小的数据集上重新训练了这个经过剪枝的模型,从而大幅提高了因剪枝导致的准确性下降。

快手直播规范

这些优化使得开发人员能够在原始数据集的一小部分上训练优化后的语言模型,从而在计算成本上节省高达 40 倍。通常情况下,AI 模型需要在模型规模和准确性之间进行权衡,但通过 Nvidia 和 Mistral AI 的新剪枝和蒸馏技术,语言模型可以同时兼顾这两者。

配备了这些增强功能的 Mistral-NeMo-Minitron 8B 据称在九项同类规模的语言驱动 AI 基准测试中表现出色。所节省的计算资源足以让笔记本电脑和工作站 PC 本地运行 Minitron 8B,使其比云服务更快且更安全。

iphone14会涨价吗

Nvidia 围绕消费者级计算硬件设计了 Minitron 8B。该语言模型被封装为 Nvidia NIM 微服务,并针对低延迟进行了优化,以提高响应速度。Nvidia 通过其定制模型服务 AI Foundry,将 Minitron 8B 调整为能够在低配置设备(如智能手机)上运行。尽管性能和准确性可能略有下降,但 Nvidia 表示该模型仍然是高准确性的语言模型,并且只需极少的训练数据和计算资源。

剪枝和蒸馏技术似乎是人工智能性能优化的下一前沿。理论上,开发者可以将这些优化技术应用于所有现有的语言模型,从而显著提升整体性能,包括那些只能由 AI 加速服务器群组运行的大型语言模型。


返回网站首页

本文评论
马斯克今天在推特说什么「马斯克要求推特全员签奋斗保证书:不签字就拿钱离开」
11月16日消息,美国当地时间周三,推特新老板埃隆·马斯克(Elon Musk)向这家社交媒体公司的员工发出最后通牒:要么致力于帮助打造新的“硬核”推特,要么以领取遣散费的形式离开公司...
日期:11-25
机构:Q3国内高端智能手机出货同比增12.3%,vivo X90s进入前十
IT之家 11 月 13 日消息,市场调研机构 Canalys 今日通过微博公布了今年第三季度中国大陆高端智能手机市场出货情况。Canalys 对“高端智能手机”的定位是售价 3500 元以上的...
日期:11-14
年内可实现量产 单体能量密度创新高-宁德时代发布凝聚态电池
【】4月19日消息,宁德时代在上海车展的第二天发布了最新电池技术凝聚态电池,单体能量密度高达500Wh/kg。同时,凝聚态电池的车规级应用版本预计会在今年内具备量产能力。三星的...
日期:10-02
贾跃亭又交车!美国著名歌手克里斯·布朗成为下一任FF91车主_贾跃亭贾布斯
快科技10月10日消息,日前,法拉第未来在其官方微博表示:全球顶尖音乐传奇和企业家 Chris Brown 将成为下一任 FF912.0Futurist Alliance 车主和开发者共创官,并将在此后的交付共...
日期:10-10
电商巨头亚马逊将关闭数十个仓库,增长率跌至 20 年来低「亚马逊发展问题」
IT之家 9 月 4 日消息,咨询公司 MWPVL 表示,在线零售巨头亚马逊正在关闭或放弃在在美国开设 42 家设施的计划,总可用空间近 2500 万平方英尺。谷歌是互联网公司吗彭博社表示,亚...
日期:09-16
ChatGPT六大劲敌:技术狂热者、天才95后、硅谷人脉王
本文系网易新闻•网易号特色内容激励计划签约账号【智东西】原创内容,未经账号授权,禁止随意转载。作者|程茜编辑|心缘转眼之间,ChatGPT已狂飙200余天。在这场空前紧迫的战事中...
日期:06-24
迎战疫情,武汉急邀全国医生加入“在线问诊”(武汉疫情的8位医生)
  2月5日消息 武汉市新型肺炎防控指挥部此前已开通“在线问诊”官方平台。今日,武汉市互联网信息办公室发文急邀全国医生加入武汉“在线问诊”。   据介绍,“在线问诊”...
日期:02-10
moto G64y新机外观配置曝光!联发科天玑7020加持
近日,摩托罗拉即将推出新款G系列手机moto G64y 5G。尽管目前尚未有关于该机的具体信息,但已经有相关信息曝光了该机的外观和关键配置。据悉,在Google Play Console列表中,moto G...
日期:03-16
好未来第三季度财报「好未来2023财年第三季度净营收2.33亿美元 同比下滑77.2%」
  讯 北京时间1月19日下午消息,好未来(NYSE:TAL)今日公布了截至2022年11月30日的2023财年第三季度财报。财报显示,好未来第三财季净营收为2.327亿美元,与上年同期的10.209亿美元...
日期:01-19
斑马条码打印机配件「斑马条码打印机配件价格表」
斑马条码打印机是指以热转印技术为基础的专门用于打印条形码的设备。斑马公司是一家全球领先的条形码打印机制造商,其打印机配件的质量和可靠性备受消费者的认可。本文将重点...
日期:05-28
三大推手拉大节前市场缺口 网购考验快递业
  当前我国一年网购规模达到4500亿元,而一般从春节前两周开始,业务量就飙升至全年的峰值。这意味着,与春运几乎同步,互联网上也涌动着一股日益壮观的电子春运大潮。   然而...
日期:07-26
谷歌waymo 2021「谷歌祭出多模态“杀器” Gemini真能碾压GPT-4吗?」
声明:本文来自于微信公众号 元宇宙日爆(ID:MBNews),作者:木沐,授权转载发布。“最大”、最有能力”、“最佳”、“最高效”,谷歌为其12月7日新发布的多模态大模型Gemini冠上了好几个...
日期:12-11
AMD 2024Q1净利润暴涨188%!两大业务赚翻了_amd 2021 业绩
快科技5月1日消息,AMD今天公布了2024年第一季度财报,收入、利润全面看涨并超出分析师预期,数据中心、客户端业务收入大涨,但是显卡、嵌入式业务出现大跌。按照GAAP(美国通用会计...
日期:05-02
2021电动车销量排行榜前十名「中国霸气占7席-2022年全球电动车销量排行榜前十名出炉」
快科技5月13日消息,近日海外汽车媒体“Motor1”公布了2022年全球纯电动车销量排名,特斯拉两款主销车上榜,而中国则霸占了7席。来看具体榜单,第一二名均来自特斯拉,分别为Model Y...
日期:09-28
小米70 红米70测评「王腾暗示小米 Redmi K70 系列手机进入全面量产阶段」
IT之家 11 月 7 日消息,Redmi 品牌发言人、Redmi 市场部总经理王腾微博发文,暗示新手机已经进入全面量产阶段。卢伟冰昨天在微博表示上班的第一件事就是开 K70 会议,结合小米的...
日期:11-07
荣耀小折叠屏新机下个月发布 将以Magic系列命名:有魔法 不废物_荣耀折叠屏手机什么时候
小折叠都是美丽的小废物”?这种固有认知,可能很快就要改变了。零跑上市公司今年2月在MWC世界移动通信大会上,荣耀CEO赵明首次透露,荣耀正在为Flip小折叠手机的发布做准备,内部已...
日期:05-30
中国移动冬装「迎战冰雪霜冻天气  中国移动暖心守护万家灯火团圆夜」
通信世界网消息(CWW)近日,全国多地遭遇暴雪冰冻天气。其中江南北部和西部、西南地区东部等地的部分地区仍有降雪或雨夹雪,贵州、湖南等地有冻雨,寒潮低温仍影响居民正常生活。面...
日期:02-08
索尼xperia1vi最新消息取消带鱼屏设计 改进核心配置 索尼Xperia-1 VI真机曝光
来源:中关村在线著名爆料人士Onleaks近日发布了索尼Xperia 1 VI的工业设计信息。这款新机与上一代相比,在正面设计风格上保持了无刘海、无挖孔的特色,但机身显著加宽。据悉,Xper...
日期:04-12
iPhone 15新增青绿色  荣耀赵明:不会有本质变化_苹果11256g绿色
距离苹果iPhone 15系列发布还有两个多月的时间。这一系列依然包括四款机型,即iPhone 15、iPhone 15 Plus、iPhone 15 Pro和iPhone 15 Pro Max。预计在影像技术和工业设计方面...
日期:07-05
顺丰控股:7月速运物流业务营业收入147.59亿元 同比增长13.52%_顺丰去年营收超千亿
查看最新行情   财联社8月18日电,顺丰控股公告,7月速运物流业务营业收入147.59亿元,同比增长13.52%;供应链及国际业务营业收入81.92亿元,同比增长346.19%。...
日期:08-19