您的位置:首页 > 互联网

有望改写AI未来_英伟达全新nGPT使训练速度暴增20倍_英伟达gf

发布时间:2024-10-20 21:38:15  来源:互联网     背景:

快科技10月20日消息,据媒体报道,NVIDIA的最新研究可能彻底改变AI的未来,其研究团队提出了一种名为归一化Transformer(nGPT)的新型神经网络架构。

英伟达 nx

英伟达 agx

英伟达最新aic

这一架构在超球面(hypersphere)上进行表示学习,能够显著提升大型语言模型(LLM)的训练速度,最高可达20倍,同时保持了模型的精度。

nGPT架构的核心在于将所有向量,包括嵌入、多层感知机(MLP)、注意力矩阵和隐藏状态,归一化为单位范数。

这种归一化处理使得输入的token在超球面表面上移动,每一层模型都通过位移来贡献最终的输出预测。

实验结果表明,nGPT在训练时所需的步骤比标准Transformer模型减少了4到20倍,具体加速效果取决于序列长度。

例如,在1k上下文中,训练速度提高了4倍;在4k上下文中,提高了10倍;而在8k上下文中,更是提高了20倍。

iPhone13发售 ,黄牛最高加价千元收购iPhone13

研究人员指出,nGPT的优化路径从超球面上的点开始,通过位移来贡献最终的输出预测,其中位移量由MLP和注意力模块定义。

免费的SSL证书

这种方法不仅提高了训练速度,还增强了模型的稳定性。

三星s22 ultra和13promax续航测试

苹果菜单页面


返回网站首页

本文评论
腾讯云AI绘画产品发布 支持超25种生成风格「腾讯云ai体验中心人脸对比」
9月9日 消息:在9月7日的2023腾讯全球数字生态大会上,腾讯云正式推出全新的AI绘画产品,它依托腾讯自研的AI绘画模型,提供AI图像生成与编辑技术API服务,使用户能够轻松地根据输入...
日期:09-09
万粉店铺月销千万,商家该怎么做小红书电商?_万粉店铺月销千万,商家该怎么做小红书电商运营
声明:本文来自于微信公众号 新播场(ID:New_bc),作者:场妹,授权转载发布。哪些商家在小红书突围?据新播场整理的小红书3月店铺热销榜,排名前三的商家月销售额已突破2500万,而上榜的...
日期:04-15
iphone12pro max5G基带「5G速度冲上万兆!iPhone 14 Pro/Max基带确认:高通骁龙X65」
iPhone 14系列正式开售,今天你拿到首批新机了吗?在消费者尝鲜iPhone 14 Pro系列“灵动岛”的同时,不少博主也对新机开启了拆解。完美世界ceo萧泓今日@微机分WekiHome 发布iPhon...
日期:09-24
十方融海科技有限公司电话「十方融海陈劢:以AI大语言模型为翼,探索数字职业教育新未来」
在当下这个科技日新月异的时代,AI大语言模型正以前所未有的速度重塑各行各业,教育领域也不例外。随着AI技术的不断成熟,其与职业教育的融合日益加深,为职业教育带来了前所未有的...
日期:10-18
背刺RTX 4090 AMD RX 7900系显卡首发DP 2.1:8K 165Hz来了
售价12999元的RTX 4090显卡在接口上略显保守,DP接口还是DP 1.4标准,NVIDIA之前解释说8K够用了,而AMD今天凌晨发布的RX 7900系列显卡直接给了友商一刀,首发了DP 2.1接口,支持8K 16...
日期:11-06
内部贪腐问题触目惊心!马化腾:腾讯的希望在这「马化腾内部信:我相信又一场大洗牌即将开始」
凤凰网科技讯 12月22日消息,12月15日腾讯在线上召开内部员工大会,大会的主题是降本增效。对于PCG部分业务的改革,“你活都活不下去了,周末还休闲的打球”,马化腾隔空喊话称,“那留...
日期:12-22
喜报频传!麦当劳中国荣获弗兰兹厄德曼全球决赛奖_麦当劳弗兰卡
在这个值得纪念的日子里,麦当劳中国的名号再次响彻云霄。我们怀着激动的心情宣告,麦当劳中国荣获了弗兰兹厄德曼全球决赛奖这一崇高荣誉。这是对中国品牌实力的又一次有力证明...
日期:05-13
镭速传输流量版:随时开启企业大数据加速传输超能力_镭速传输软件
  很多企业只需要用到一些即时通讯工具(如微信、QQ、邮箱等)即可搞定日常文件往来工作,他们只在某些特定的时间或者情境下才会有大型数据集加速传输的需求。部分企业大数...
日期:07-14
杭州一女子求职 招聘者称“36岁来碰瓷公司”_杭州碰瓷团伙
11月1日消息,据钱江晚报报道,杭州刘女士在某APP上求职时,一位招聘者回复她36岁来碰瓷公司啊”。刘女士表示,这个人劈头盖脸地就对我说了上面那些话,我很不能接受。我又没有主动联...
日期:11-02
猎户星空申请“猎户座大语言模型”等商标_猎户星空百度百科
11月27日 消息:据天眼查显示,北京猎户星空科技有限公司近日向国家商标局申请注册了“猎户座大语言模型”和“猎户座大模型”两个商标。该公司由猎豹移动投资,是一家人工智能机...
日期:11-27
科技强警 银河水滴步态识别技术亮相厦门公安科技展
  5月27日至28日,厦门市公安局在人民警察培训学校举办2021年度先进科技产品展览,包括华为、百度、银河水滴、旷视、商汤等在内的42家国内先进科技厂商受邀参展,带来了人工智...
日期:12-21
谷歌和Facebook据称有意收购“推特”
  多家西方媒体10日报道,搜索引擎巨头谷歌公司和热门社交网站脸谱等互联网企业已就收购微博网站推特与后者展开“低级别谈判”。《华尔街日报》以知情者为消息源报道,谈判...
日期:07-26
数学模型起源「专注数学的开源大模型LLEMMA来了 性能领先其他数学语言模型」
要点:1. LLEMMA 是一个开源的大型语言模型,专门设计用于解决数学问题,并且在性能上超越了其他领先的数学语言模型。2. LLEMMA 能够利用工具和证明形式定理来解决数学问题,而无...
日期:10-22
佳能eos r报价「19499元仅有2525套!佳能EOS R6 Mark II 25周年限量版发布」
佳能今日推出了EOS R6 Mark II 25周年限量版套装,仅发售2525套,售价19499元。这款限量套装里有EOS R6 Mark II机身一台、限量版肩带一条、徽章两枚,还有小泽秀树董事长的亲笔感...
日期:11-25
三星在 2023 年 ISUOG 世界大会上展示基于 AI 的自动测量和诊断解决方案
10月17日消息:三星电子发布新闻稿宣布,三星电子的子公司三星医疗,将在 2023 年 10 月 16 日至 19 日在韩国首尔举办的国际产科和妇产科超声波学会(ISUOG)世界大会上展示其基于人...
日期:10-17
惠普存储官网「HP P900移动SSD支持全新惠普智慧存储软件,提升用户高效安全存储体验」
HP P900新一代高速移动固态硬盘自推出以来就颇受欢迎,其具备高达2000MB/s的读写速度,小巧便携的体积,主流Type-C接口,时尚配色及可靠的品质,在存储高效性、便携性、实用性等方面...
日期:03-01
腾讯加速器宣布升级,停止加速外服业务并开通退款通道_腾讯加速器怎么退款
  腾讯加速器官方今日发布公告宣布,因业务运营策略调整,2022 年 5 月 31 日起「腾讯网游加速器」将升级为「腾讯游戏管家」,之后将仅支持国服游戏加速,对于受影响的会员用户...
日期:07-18
理想汽车2023年第三季度财报:交付105108辆汽车 同比增长296.3%_理想汽车2021年三月份销量
11月9日 消息:2023年11月9日,理想汽车公布2023年第三季度财报,季度交付量和财务表现均创历史最佳。小鹏销售公司总经理其中,第三季度交付105,108辆,同比增长296.3%,本季度蝉联30万...
日期:11-10
调休有变「调休为什么让人如此疲惫?五一假期前后都要调休上班上热搜」
昨日,众多网友纷纷热议“调休”这一话题,使其迅速攀升至热搜榜首位。好消息是,距离下一个长假——劳动节假期,还有仅仅24天的时间。凡态智能锁好不好根据安排,今年的劳动节假期将...
日期:04-08
内容为王的泛资讯行业,都有哪些大趋势值得关注?
“移民火星的建筑材料该怎么选?”“年纪轻轻就得了脑梗塞,这个病来临前究竟有哪些先兆?”“制造口罩的核心技术都有哪些?”......这些不乏专业、甚至带着一丝丝硬核味道的问...
日期:08-02