您的位置:首页 > 互联网

GPT-4o mini突然上线!该换小模型赛道的OpenAI意欲何为?_mini gp1

发布时间:2024-07-22 16:40:15  来源:互联网     背景:

声明:本文来自于微信公众号 新火种,作者:小岩,授权转载发布。

ChatGPT 正式进入了“4”时代。

7月18日,OpenAI 官宣推出了GPT-3.5Turbo的替代品——GPT-4o mini,至此,ChatGPT的更新迭代又近了一步,来到了4字开头的时期。据了解,即日起,ChatGPT的免费用户,Plus用户以及Team用户都能够使用GPT-4o mini,企业版客户也会在随后获得使用GPT-4o mini的权限。

mini gp国内

OpenAI杀入小模型赛道!GPT-4o mini究竟有哪些过人之处?

在各大AI企业争相推出产品的当下,OpenAI的更新速度并不算太快。很多人都希望蛰伏许久的OpenAI能够一出手,就干件大事儿,诸如推出一个在各个方面都能碾压上一代产品的GPT-5.0。也正因此,很多人对于GPT-4o mini的出现感到些许失望。

但需要说明的是,GPT-4.o mini不仅不是一无是处,反而是一个极具代表性的产品。OpenAI把GPT-4o mini描述为“一个具有卓越文本智能和多模态推理能力的小模型”,这就对其进行了精准定位:小模型赛道上的领先产品。

日产召回查询

mini gp参数

据OpenAI介绍,GPT-4o mini目前在LMSYS排行榜上的聊天偏好方面优于GPT-4,在文本智能和多模态推理方面的学术基准测试中超越了GPT-3.5Turbo和其他小型模型,并且支持的语言范围与GPT-4o相同。而GPT-4o mini在函数调用方面也表现出色,可以使开发人员构建获取数据或使用外部系统采取行动的应用程序。

此外,与GPT-3.5Turbo相比,GPT-4o mini的长上下文性能有所提高,已经在几个关键基准上进行了评估,即推理任务,数学和编码能力以及多模态推力。

在推理任务方面,GPT-4o mini在涉及文本和视觉的推理任务上优于其他小型模型,在文本智能和推理基准MMLU上的得分为82.0%,而Gemini Flash为77.9%,Claude Haiku为73.8%;在数学和编码能力方面,GPT-4o mini的表现优于市场上之前的小型模型,在测量数学推理的MGSM上,GPT-4o mini得分为87.0%,而Gemini Flash得分为75.5%,Claude Haiku得分为71.7%;在测量编码性能的HumanEval上,GPT-4o mini得分为87.2%,而Gemini Flash得分为71.5%,Claude Haiku得分为75.9%;在多模态推理方面,GPT-4o mini在多模态推理评估MMMU中也表现出色,得分为59.4%,而Gemini Flash为56.1%,Claude Haiku为50.2%。

更重要的是,GPT-4o mini还有一项极具竞争力的优势:价格足够实惠。

OpenAI表示,开发人员使用GPT-4o mini时,每100万个输入tokens需支付15美分,每100万个输出tokens需支付60美分。这个定价比之前的Frontier型号便宜了足足一个数量级。即便与自家的上一代产品GPT-3.5Turbo也要便宜60%以上。

GPT-4o用起来究竟如何?一手测评结果:懂得不算多,但速度绝对快。

当然,理论上的优势说的再多,也不及大家的实际体验来得重要和直观。

目前,GPT-4o mini 在 WildBench 测试上排名第9,优于谷歌的Gemini-flash以及 Anthropic的Claude3Haiku。看得出来,大家对于这款新晋产品还是很感兴趣的。

有网友在GPT-4o mini开放测试的第一时间就赶过去问它了一个问题:9.11和9.9哪个大?

很遗憾,GPT-4o mini没有给出正确的答案,不仅没有给出正确的答案,还在错误的路上越走越远,一本正经地回答9.11大于9.9,因为0.1大于0.9。

随后,网友在 Poe(Quora 开发的应用程序,已经集成了 GPT-4o mini)中输入人物传记电影《Eno》的设计封面,让GPT-4o和GPT-4omini模型进行解读,结果 mini翻车了。GPT-4o mini 直接表示“自己认不出照片上的人”,反而是GPT-4o的回答就比较准确。

不过,说起响应速度,那么GPT-4o mini确实对得起OpenAI给予的“faster”标签。与它进行对话,几乎无需任何等待,输出速度堪称快的离谱。

小米路由器升级wifi7

冯建新摄影作品

尽管就目前来看,GPT-4o mini回答问题的准确性还有待提高,但不可否认,它目前已经是性能最为优越的小模型了,完全可以超越GPT-3.5Turbo和其他小模型。据了解,GPT-4o mini的知识更新到去年10月,语言种类和GPT-4o对齐,上下文窗口为128k。

当下的GPT-4.o mini在API中仅支持文本和视觉模态,而在不久的未来,它还将扩展到视频和音频的输入及输出。尽管还没有任何参数规模被披露,但OpenAI的官方直接表示,这是他们目前最经济,最有成本效益的小模型了,微调功能也将很快上线。

小模型的出现,才能真正完成OpenAI的使命?

虽然GPT-4o mini是一个小模型,但相较于大模型,它在性能上并没有做出太大妥协。

得益于优化的架构设计和高效的算法,GPT-4o mini 能够在保留大模型强大性能的基础上,提供更加轻量级的解决方案。这使得它在处理文本生成,对话和翻译等任务时,依然能够表现出色。

但是问题来了,先前一直在做大模型的OpenAI为什么选择转头深耕小模型赛道?

OpenAI API方面的负责人Godement表示,这涉及到一个“优先考虑”的问题。此前,OpenAI专注于GPT-4这样的大模型,而随着时间的推移,OpenAI终于注意到了开发者们渴望对小模型的愿景,才终于决定投入资源。据了解,OpenA对于GPT-4o mini是非常有信心的,认为其一定会非常受欢迎。

事实的确如此。对于渴望低成本构建应用的开发者来说,GPT-4o mini来得太及时了。譬如金融初创公司Ramp在测试中,就用它构建了提取收据上费用的工具,不必费力浏览文本框,模型就会自动对所有内容排序,大大提高了工作效率。

在OpenAI设想的未来里,模型将会被无缝集成到每一个应用程序和每一个网站之上。如今,随着GPT-4o mini的推出为开发者更高效、更经济地构建和扩展强大的AI应用铺平道路。可以看到,AI正在变得更容易访问,可靠,并会融入到所有人的日常体验中。而OpenAI,则会继续引领这一进程。

曾几何时,OpenAI也是一心要走大模型之路的,可惜这条路它们走得并不顺利。尽管相较于上一波AI公司,OpenAI创造了更大的现金流,但从战略上说,它并没有把自己倒腾到一个合适的位置上。

在这种情况下,一味死磕大模型,很有可能给公司造成毁灭性的打击,会导致高昂的人才,训练成本根本找不到落点。更可怕的是,一旦技术增长停滞后,它的客户端注定会把它踢掉或者在多个供应商之间压价。这就会导致大模型公司变成赚钱费劲,花钱很痛快的公司,这是没法长久维持的。所以做大模型。不管创造了多少收入,本质上还在险境里面。

如今,OpenAI显然找到了更适合自己的打开方式。但有一点毋庸置疑,大模型要卷,小模型也要卷,不卷是不可能的。

图片来源于网络

文字资料参考:

公众号“新智元”文章《奥特曼深夜发动价格战,GPT-4o mini暴跌99%!清华同济校友立功,GPT-3.5退役》

https://www.zhihu.com/question/662021096/answer/3567789827

https://baijiahao.baidu.com/s?id=1804991663805668979

mini gp多少钱


返回网站首页

本文评论
1280亿市值却被48亿收购,雅虎究竟为何要贱卖_消息称雅虎有意出售亚洲资产而非整体出售
  10月29日消息,据国外媒体报道,消息来源透露,雅虎有意出售其亚洲资产并且向股东派发收益,而非向收购者整体出售自己。   消息人士称,对于雅虎来说,出售亚洲资产是它可能性最...
日期:07-24
深耕工业物联网,爱快SD-WAN解决方案垂直触达!
  在新一代技术的推动下,以及“中国制造2025”国家战略的政策扶持下,我国工业物联网发展突飞猛进。当前,工业物联网已经渗透到智能制造、智能电网、智能交通、智慧水利、...
日期:07-18
EasyVideoTrans完全指南:英文视频转中文翻译工具 - 使用方法教程与免费试用入口
探索EasyVideoTrans能为你带来哪些改变目前市场上最好的全画幅微单相机特斯拉上海超级工厂二期进展为什么选择EasyVideoTrans?EasyVideoTrans不仅仅是一款产品——它是一项革...
日期:07-19
货拉拉入局跑腿业务 预计3月中旬全面开放骑手注册
2月9日消息,今日,有媒体报道称,货拉拉将入局跑腿业务。对此,货拉拉方面向TechWeb确认了该消息。货拉拉方面表示,货拉拉将推出同城门到门跑腿服务——货拉拉跑腿,两轮电动车将成为...
日期:02-09
B站扶持月均平台收入不足5000元UP主:每月最高可获2000元激励_b站up主平均一个月挣多少钱
快科技3月18日消息,今日B站发布视频创作激励年度计划(2024版),重点关注暂无变现能力的UP主,作为基础激励的扶持对象。11代酷睿cpu集显用什么驱动据悉,24年激励计划规则具体如下:1、...
日期:03-18
上汽集团2021年3月汽车销量「汽车之家2022年第三季度营收18.43亿元 净利润5.078亿元」
11月4日 消息:汽车之家发布了截至2022年9月30日止第三季度业绩。2022年第三季度,该集团期间内净收入总额为18.43亿元(人民币,下同),同比增加4.48%;归属于汽车之家的净利润为5.08...
日期:11-06
15 Pro机模视频展示新按钮、USB-C等外观设计 苹果iPhone
日前一个 iPhone 15 Pro 机模出现在抖音分享的视频中,提供了对该设备传闻中的设计的近距离观察。预计关键硬件特征包括固态按钮、USB-C 端口和钛合金框架。除了现有的传言,该...
日期:10-03
Pro原神派蒙主题礼盒开售_全方位深度定制 「3599元-一加Ace2」_原神派蒙吧
8月16日,全新的一加Ace 2 Pro正式发布,该机搭载高通骁龙8 Gen2移动平台,最高配备24GB内存,是行业里内存最大的骁龙8 Gen2机型,在前几天的首销中非常受欢迎,20万台现货在3分钟内被...
日期:09-10
苹果a15芯片参数主频「但性能或不尽如人意 iPhone-15 Pro首发苹果A17芯片」
【】这段时间以来,外界关于新一代的iPhone 15系列的爆料越来越密集,不出意外的话该系列将继续推出包含iPhone 15、iPhone 15 Plus、iPhone 15 Pro和iPhone 15 Ultra四款机型,其...
日期:10-06
如何提升玻璃清洁剂性能?配方分析有妙招!_玻璃清洁剂使用方法及比例
  玻璃清洁剂作为清洁类消费品,被广泛运用在各行各业的玻璃清洁工作中,肩负着为人们提供清洁生活生产的使命。而玻璃清洁剂的配方分析可以使产品更新换代提升清洁力度与使...
日期:07-17
增程车必然被淘汰 谁买坑谁?消息称华为问界要降价 你买吗
随着特斯拉国产全系降价,这对不少汽车厂商来说,都多少有些压力,而大家会怎么应对呢?现在,有博主给出消息称,华为问界要有大消息宣布,而从不少网友的反馈看,就是降价促销。有网友表示...
日期:01-13
16年互联网“老将”第三次冲击IPO,3年半亏掉10多亿_互联网巨头暴跌
声明:本文来自微信公众号“天下网商”(ID:txws_txws),作者:王卓霖,,授权转载发布。一只曾站在风口的“猪”,准备上市了。最近,港交所公布了猪八戒股份有限公司(下称“猪八戒网”)递交...
日期:11-03
马斯克的"读脑"设备首次植入人体,科学家期待什么?担忧什么?
2月4日消息,埃隆·马斯克(Elon Musk)创建的Neuralink旨在改变我们对脑机接口的认知,让科幻变成了现实。1月29日发布的消息中,马斯克宣布Neuralink已成功将其“读脑”设备首次植入...
日期:02-06
a15 gpu提升「苹果A16芯片GPU直接抄袭A15 系统缓存还缩水了」
TechInsights公布了A16的透视图,根据他们描述是想探究下4nm工艺下的A16具体有哪些提升。而从透视图来看A16确实比A15要大一些,晶体管数量增加6%的体积膨胀。A16的CPU核心组成...
日期:09-29
玩手机睡眠障碍「央视曝近七成晚睡是因为手机,睡眠障碍也属精神障碍」
中关村在线消息:10月10日,据相关爆料,最近有专家调查,近七成人群晚睡的原因是熬夜看手机,不论是玩手机、追剧、打游戏都会在一定程度上影响到大家入睡。并且,有专家表示,不少人睡前...
日期:10-11
印度塔塔集团收购台企在印工厂,将为iPhone代工_印度塔塔集团市值是多少
(观察者网讯)当地时间27日,印度电子暨资讯科技部国务部长拉吉夫·钱德拉塞卡尔在社交平台“X”上宣布:印度塔塔集团接管iPhone重要供应商纬创资通的印度业务,塔塔将在两年半内开...
日期:10-28
上海 联通 5g「海派大5G,上海联通携手华为点亮5G-A新生活」
通信世界网消息(CWW)海派文化源远流长,以其与时俱进的开放性品格,在世界文化交融激荡中绽放独特光彩,为上海全面建成社会主义现代化国际大都市提供了强大的文化支撑和精神动力。2...
日期:05-16
中国信息通信研究院联合中兴通讯共同发布《确定性承载技术和评测体系蓝皮报告》
2023/5/25 18:13 中国信息通信研究院联合中兴通讯共同发布《确定性承载技术和评测体系蓝皮报告》   近日,在2023年云网智联大会确定性网络分论坛上,中国信息通信研究院(以...
日期:05-26
骁龙7系列5g「「骁龙X75再突破Sub-6GHz全球纪录,集十项全球首创特性于一身」」
来源:中关村在线作为高通第六代5G调制解调器及射频系统,骁龙X75支持包括基于TDD频段的四载波聚合(CA)以及1024QAM在内的先进5G特性,能够在5G独立组网(SA)网络配置下实现Sub-6GHz频...
日期:09-03
能接受吗!康师傅方便面全线涨价 网友吐槽到上热搜:官方回应了
7月6日消息,据国内媒体报道称,康师傅方便面将于7月1日起调整经典系列产品出厂价,这引起了网友的围观。关于涨价,公司文件中提到:经典系列升级将更好满足消费者需求,同时兼顾质量与...
日期:07-06