您的位置:首页 > 互联网

opencv嵌入式开发板「OpenAI新模型用的嵌入技术被网友扒出来了」

发布时间:2024-01-29 11:25:43  来源:互联网     背景:

声明:本文来自于微信公众号 机器之心(ID:almosthuman2014),作者:机器之心,授权转载发布。

前几天,OpenAI 来了一波重磅更新,一口气宣布了5个新模型,其中就包括两个新的文本嵌入模型。

我们知道,嵌入是表示自然语言或代码等内容中概念的数字序列。嵌入使得机器学习模型和其他算法更容易理解内容之间的关联,也更容易执行聚类或检索等任务。

使用更大的嵌入(比如将它们存储在向量存储器中以供检索)通常要比更小的嵌入消耗更高的成本、以及更多的算力、内存和存储。而 OpenAI 此次推出的两个文本嵌入模型分别是更小且高效的 text-embedding-3-small 模型和更大且更强大的 text-embedding-3-large 模型。

这两个新嵌入模型都使用一种技术进行训练,允许开发人员权衡使用嵌入的性能和成本。具体来说,开发者通过在 dimensions API 参数中传递嵌入而不丢失其概念表征属性,从而缩短嵌入(即从序列末尾删除一些数字)。例如在 MTEB 基准上,text-embedding-3-large 可以缩短为256的大小, 同时性能仍然优于未缩短的 text-embedding-ada-002嵌入(大小为1536)。

opencv嵌入式开发板

这一技术应用非常灵活:比如当使用仅支持最高1024维嵌入的向量数据存储时,开发者现在仍然可以使用最好的嵌入模型 text-embedding-3-large 并指定 dimensions API 参数的值为1024,使得嵌入维数从3072开始缩短,牺牲一些准确度以换取更小的向量大小。

OpenAI 所使用的缩短嵌入方法,随后引起了研究者们的广泛注意。

人们发现,这种方法和2022年5月的一篇论文所提出的Matryoshka Representation Learning方法是相同的。

OpenAI 的新嵌入模型更新背后隐藏的是 @adityakusupati 等人提出的一种很酷的嵌入表征技术。

而 MRL 的一作 Aditya Kusupati 也现身说法:OpenAI 在 v3嵌入 API 中默认使用 MRL 用于检索和 RAG!其他模型和服务应该很快就会迎头赶上。

马斯克一天损失152亿

那么 MRL 到底是什么?效果如何?都在下面这篇2022年的论文里。

MRL 论文介绍

  • 论文标题:Matryoshka Representation Learning

  • 论文链接:https://arxiv.org/pdf/2205.13147.pdf

研究者提出的问题是:能否设计一种灵活的表征方法,以适应计算资源不同的多个下游任务?

MRL 通过以嵌套方式对 O (log (d)) 低维向量进行显式优化在同一个高维向量中学习不同容量的表征,因此被称为 Matryoshka俄罗斯套娃。MRL 可适用于任何现有的表征 pipeline,并可轻松扩展到计算机视觉和自然语言处理中的许多标准任务。

图1展示了 MRL 的核心理念以及所学习 Matryoshka 表征的自适应部署设置:

Matryoshka 表征的第一个 m-dimensions(m∈[d])是一个信息丰富的低维向量,不需要额外的训练成本,其精确度不亚于独立训练的 m 维表征法。Matryoshka 表征的信息量随着维度的增加而增加,形成了一种从粗到细的表征法,而且无需大量的训练或额外的部署开销。MRL 为表征向量提供了所需的灵活性和多保真度,可确保在准确性与计算量之间实现近乎最佳的权衡。凭借这些优势,MRL 可根据精度和计算约束条件进行自适应部署。

在这项工作中,研究者将重点放在了现实世界 ML 系统的两个关键构件上:大规模分类和检索。

在分类方面,研究者使用了自适应级联,并使用由 MRL 训练的模型产生的可变大小表征,从而大大降低了达到特定准确率所需的嵌入式平均维数。例如,在 ImageNet-1K 上,MRL + 自适应分类的结果是,在精度与基线相同的情况下,表征大小最多可缩小14倍。

同样地,研究者在自适应检索系统中也使用了 MRL。在给定一个查询的情况下,使用查询嵌入的前几个 dimensions 来筛选检索候选对象,然后连续使用更多的 dimensions 对检索集进行重新排序。与使用标准嵌入向量的单次检索系统相比,这种方法的简单实现可实现128倍的理论速度(以 FLOPS 计)和14倍的墙上时钟时间速度;需要注意的是,MRL 的检索精度与单次检索的精度相当(第4.3.1节)。

macbook pro 13寸和16寸对比

最后,由于 MRL 明确地学习了从粗到细的表征向量,因此直观地说,它应该在不同 dimensions 之间共享更多的语义信息(图5)。这反映在长尾持续学习设置中,准确率最多可提高2%,同时与原始嵌入一样稳健。此外,由于 MRL 具有粗粒度到细粒度的特性,它还可以用作分析实例分类难易程度和信息瓶颈的方法。

opencv嵌入式开发

ai嵌入式应用开发

更多研究细节,可参考论文原文。

华为mate30支持北斗卫星吗?

每日优鲜股价破发


返回网站首页

本文评论
花点时间不断优化鲜花供应链 确保花材高品质
  对于任何一个企业而言,优化供应链体系能够以最低的成本获取到最大的经济效益,同时还可为用户提供更好的体验,新消费鲜花生活方式品牌花点时间深谙此理。自2015年品牌成立...
日期:08-19
租金一月1万元!蔚来在欧洲四国“只租不卖” 李斌回应
近日,蔚来在柏林举办NIO Berlin 2022活动,正式宣布开启在德国、荷兰、丹麦、瑞典四国市场的服务。钉钉消息小红点2019年3000元性价比高的手机风管机和中央空调效果一样吗曝iph...
日期:10-15
小米手机超越苹果:国外用户不买iPhone改用小米_苹果为什么不告小米
根据市场调研机构Counterpoint的数据统计报告显示,在2022年Q3的欧洲智能手机市场上,三星依旧独占市场33%的份额,接近三分之一的份额拿下第一名,而小米则以23%的份额位居第二名。...
日期:11-30
委员建议六三三学制改为五二三:早2年高中毕业_六三三制是什么学制五二二
针对义务教育制度,全国政协委员、福建省政协副主席阮诗玮带来了新的提议。他通过调研后认为:当前,人口社会结构、劳动人才需求对我国教育提出了新的要求,沿用六三三基础教育学制...
日期:03-05
撸串界顶流!游戏《愤怒的小鸟》创始人坐高铁赶往淄博吃烧烤_愤怒的小鸟游戏百科
4月12日消息,最近淄博烧烤”爆火出圈,成为撸串界顶流,吸引了无数外地游客专程来打卡。数据显示,今年3月以来,淄博当地烧烤”关键词搜索量同比去年增长超370%,淄博烧烤”关键词全平...
日期:04-12
同花顺问财专业版怎么样「同花顺问财大模型HithinkGPT体验入口 AI理解聊天机器人免费使用地址」
同花顺问财大模型HithinkGPT是同花顺问财推出的一款人工智能聊天机器人产品。它拥有强大的自然语言理解和生成能力,能够流畅地与用户进行闲聊交流,同时针对用户的问题给出专业...
日期:01-03
即信云通信参加中国车联网大会 助力智慧交通新时代_中国智能网联汽车创新成果大会
  日前,由国家工信部、深圳市人民政府联手主办的中国车联网产业展览会于深圳会展中心盛大召开。玄武科技·即信云通信与全国各大研究院、政企机关、知名企业等代表参与大...
日期:03-01
日本飞机爆炸死了520「日本客机爆燃!滑行中炸成火球:机上近400人已全部撤离」
1月2日消息,据日本广播协会报道,今日在羽田机场起火的日本航空客机搭载的机组人员和乘客近400人已全部撤离。三星one ui什么时候推出?今日下午,日本航空公司飞机在羽田机场降落...
日期:01-02
隐私计算前景「深度解析丨一文读懂隐私计算多种技术路线」
数据安全共享和价值转化既是政策导向,也是大数据和数字经济发展的关键。隐私计算技术,已成为数据流通安全的“最 优技术解”。政策法规加速落地,市场关注度快速提升。我国多部...
日期:09-27
电视盒子处理器天梯图,2022机顶盒CPU天梯图_电视盒子cpu天梯2020
  CPU是任何一款数码产品的核心,最近很多用户买电视盒子的时候都会问起电视盒子的CPU,所以今天给大家整理一个最新的电视盒子CPU天梯图,并对每款CPU进行一个简单的讲解,...
日期:07-10
CodeFuse微调框架MFTCoder升级v0.3.0版本 支持Mixtral等模型
1月22日 消息:MFTCoder 是蚂蚁CodeFuse开源的一种多任务微调框架,可以在多个任务上同时进行微调。它通过结合多种损失函数解决了多任务学习中的挑战。MFTCoder 具备高效训练...
日期:01-22
Soul创始人张璐携团队深挖元宇宙内涵 与Z世代共同探索社交新时代(soul张璐微信)
2021 年是元宇宙元年,一时之间“元宇宙”三个字席卷了互联网的各个角落。而国内对于元宇宙的比较初探索也可以追溯到 2016 年上线的社交应用:Soul,其创始人张璐与团队在与年轻...
日期:08-17
《黑色行动》设计总监离职_黑色行动结局什么意思
Treyarch工作室设计总监David Vonderhaar宣布已离开为之奋斗的《使命召唤》去追寻新的事业:今天要告诉大家我离开了动视与Treyarch,我在此度过令人难忘的十八年,交付了八款年货...
日期:08-19
天猫养车推出“天猫养车精英俱乐部”_天猫养车车划算
10月8日消息,由天猫养车联合运营中心举办的首届“天猫养车精英俱乐部——916沙漠心灵之旅”近日顺利闭营,旅程中举行了一场以“享”为主题闭门座谈会,邀请天猫养车精英俱乐部成...
日期:10-16
特斯拉新款Model Y上市 26.39-34.99万元_特斯拉model y 2022款
特斯拉新款Model Y车型于10月1日正式上市,售价区间为26.39-34.99万元。新款Model Y在造型和内饰细节等多方面进行了小规模的升级,而定价并未发生改变,这意味着新款车型的竞争力...
日期:10-01
ai视频编辑器「AI在线视频剪辑工具Opus Clip 长视频一键变高质量短视频」
8月21日 消息:Opus Clip 是一款生成式人工智能视频工具,可以将长视频一键转换成高质量短视频,让您可以在 TikTok、YouTube Shorts 和 Reels 等平台上分享,以增加社交媒体的影响...
日期:08-21
华为公开智能汽车技术领域新专利,可实现多屏交互功能_华为在智能汽车领域又有新动作
  8 月 31 日消息 今日,华为技术有限公司公开“一种多屏交互的方法、装置、终端设备和车辆”专利,公开号为 CN113330395A。   该申请提供了一种多屏交互的方法、装置、...
日期:07-17
就等小米13 Ultra发布了!米粉晒工资:称“资金已到位”_小米13最新官方消息
快科技4月10日消息,一位米粉在酷安小米13 Ultra版块晒出了刚到账的1万多工资,称资金已经到位”,就等新品发布。根据小米官方公布的信息,小米13 Ultra会在本月发布。对于小米13 U...
日期:04-10
中芯国际收购格芯成都厂「遗憾,中芯国际与格芯原本只差0.3%,现在越来越远了」
近日,知名分析机构TrendForce发布了2023年二季度全球10大晶圆代工企业的排名情况。从排名来看,前10大企业分别是台积电、三星、格芯、联电、中芯国际、华虹集团、高塔半导体、...
日期:09-08
亚马逊首批互联网卫星6日拟升空_亚马逊ceo将于7月20日飞往太空
通信世界网消息(CWW)据英国《新科学家》周刊10月5日报道,亚马逊公司将于10月6日发射其有史以来的首批卫星,该公司启动了名为“柯伊伯计划”的太空互联网服务计划,希望能与太空探...
日期:10-07