您的位置:首页 > 互联网

奥特曼比试「奥特曼:自认比o1聪明请举手」

发布时间:2024-10-04 11:02:49  来源:互联网     背景:

声明:本文来自于微信公众量子位 | 公众号 QbitAI,作者:梦晨,授权转载发布。

奥特曼:认为自己比o1更聪明的请举手。

(台下一些人举手

奥特曼认清

奥特曼:到了o2你们还会这么想么?

(汗流浃背了

自己是奥特曼

这一幕,刚刚在OpenAI开发者日最后一个环节——奥特曼炉边谈话中上演。

对话由奥特曼和OpenAI首席产品官Kevin Weil进行,奥特曼还对未来作出如下判断:

  • 无限上下文长度将在十年内发生

  • o1正在推动智能体应用,人们将要求AI在一小时内完成以前人类数月或数年的工作

  • 然后每个人将拥有10个智能体,再然后拥有1000个

  • 担心科幻(Sci-fi)是我们最重要的事之一

除此之外,活动上宣布了OpenAI API大量重磅更新:

  • 实时语音API:每个APP里都可以拥有“Her”

  • 视觉微调API:只需100张图提升GPT-4o特定任务图像理解能力

  • 自动提示词缓存:模型最近见过的输入tokens统统打5折

  • 模型蒸馏API:用前沿模型的输出微调GPT-4o mini

奥特曼比试

围绕这些功能的精彩现场演示,也引起众人围观。

比如GPT-4o驱动的实时语音API, 配合函数调用+Twillio(云通讯服务),可以直接打电话订外卖了。

订购400个草莓裹巧克力酱甜点,参会者人人都有的吃。

看起来演示现场是OpenAI员工在台上扮演食品店员工,真正的订购过程是在幕后完成。

没过一会,还有人晒会场外草莓快被领完了。

最新发布的推理大模型o1也露了一手,从头编程操控无人机,现场芜湖起飞。

这边大会办得热闹,与OpenAI相关的周边消息也不断传出:

刚刚离职的几位中,前研究VPBarret Zoph已决定要成立一家新公司

前CTOMira Murati还没宣布下一步要干什么,但投资人开始围追堵截她,希望她尽快成立自己的公司

还有一位此前已离职的OpenAI联合创始人Durk Kingma,宣布加入隔壁Anthropic

OpenAI开发者日

与去年相比,今年的OpenAI开发者日活动不再现场直播,并拆分成三部分在不同地点举办(美国、英国、新加坡)。

刚刚在旧金山举办的第一场,宣布了多项API更新。

Realtime API

实时语音API为公开测试版,所有开发者都能在自己的APP中构建与ChatGPT高级语音模式类似的体验

价格也不贵,每分钟音频输入约0.06美元,每分钟音频输出约0.24美元。

语言学习应用Speak已使用Realtime API开发AI角色扮演练口语功能。

此外还在Chat Completions API中增加了音频输入和输出,可以用在对时延要求不高的地方,将在未来几周内作为gpt-4o-audio-preview发布。

视觉微调

开发者现在可以用图像对GPT-4o微调,以提高视觉能力

可以用来增强视觉搜索功能、改进自动驾驶汽车或智能城市的物体检测以及更准确的医学图像分析等应用。

外卖和共享出行公司Grab,将车道计数的准确性提高20%,将限速标志的定位提高13%。

自己是奥特曼的视频

在UI设计上,微调过的GPT-4o生成的网页区域也能更好匹配整个页面的风格。

自己是奥特曼的视频

视觉微调的过程与文本微调类似,按照OpenAI指定的格式准备图像数据集,然后将数据集上传到OpenAI开发平台

只需使用100张图像就能提高GPT-4o在视觉任务中的性能,当然用的更多提升也能更大。

GPT-4o的微调费用为$25/100万tokens,微调后推理费用为每100万个输入tokens3.75美元,每100万个输出令牌15美元。

不过在2024年10月31日之前,每天免费为视觉微调提供100万个训练token

羊毛薅起来~

提示词缓存

许多开发者在构建人工智能应用程序时,会在多个API调用中重复使用相同的上下文,例如在编辑代码库或与聊天机器人进行长时间、多轮对话时。

提示词缓存功能可以在降低成本的同时降低推理延迟

iphone 5c官方宣传动画片

OpenAI推出这个功能是比较晚的,此前谷歌Gemini、Claude,以及国内DeepSeek,Kimi等都已上线。

不过OpenAI搞出来的特色在于:一切都是自动的。

从今天起,提示词缓存已适配最新版本的GPT-4o、GPT-4o mini、o1-preview和o1-mini,以及这些模型的微调版本。

只要是AI见过的token,自动统统打五折。

奥特曼聪不聪明

缓存将在闲置5-10分钟后清除,最多保留1小时。

模型蒸馏

让开发者可以用o1-preive和GPT-4o等前沿模型的输出,对GPT-4o mini等小模型微调

此前,模型蒸馏是一个多步骤、易出错的过程,需要开发人员在互不关联的工具中手动协调多个操作,从生成数据集到微调模型和评估性能。

由于蒸馏本质上是迭代的,需要反复运行每个步骤,大大增加了工作量和复杂性。

这次OpenAI推出了新的集成工作流程,可自动获得前沿模型生成的输入-输出对、运行自定义评估、以及完成微调。

自己是奥特曼

同样在10月31日之前,在GPT-4o mini上每天提供200万个免费培训token,在GPT-4o上每天提供100万个免费训练token

离职高管被资本热捧,联创加入Claude团队

OpenAI持续发布新模型、新功能的压力,让OpenAI内部研究和安全团队疲于奔命,难以跟上步伐。

此前已有消息证实GPT-4o发布前,团队只有9天时间做安全评估,每天工作20多个小时。

财富杂志最新消息表示,o1发布前也遇到了同样的情况,并且在公司高层之间引发了摩擦

许多向前CTOMiraMurati汇报工作的团队都认为o1还没有做好发布的准备,还没有真正形成产品,不过他们的反对意见被驳回了。

除了奥特曼之外唯一还在的联创Woijceich Zarembra发声,承认了在o1开发阶段他和后训练团队负责人Barret Zoph发生激烈冲突,但没有透露详细细节。

奥特曼认清

现在后训练团队仍在继续完善o1,但Barret Zoph已经辞职了。

Barret Zoph目前表示将成立一家新公司,但目前尚不清楚他具体会做什么,也不清楚他是否会和Murati合作。

奥特曼聪不聪明

广电192资费标准

再看Murati这边,她本人还没有宣布下一步任何计划,但投资人争相与她会面,希望她尽快创办自己的公司

据Business Insider消息,许多投资人正在试图接近她,即使以前没有联系过的也会给她发冷邮件。

作为去年11月奥特曼被短暂赶下台的余波,OpenAI高层持续动荡,已经流失不少研究和管理人才。

与此同时,OpenAI 一直在疯狂招聘,规模相比去年扩大了一倍多,员工人数从不到800人增加到1800人。

有老员工开始抱怨:新员工的涌入改变了OpenAI的氛围和文化。

关于研究的对话少了,关于产品或向社会部署的对话多了。

离职的OpenAI研究人才中,有相当一部分去了隔壁Anthropic。

联合创始人John Schulman、超级对齐负责人Jan Leike跳槽加入之后,Anthropic又吸引来一位早年已经离职的OpenAI联创Durk Kingma

自称奥特曼

Durk Kingma博士毕业于阿姆斯特丹大学,师从机器学习大牛Max Welling。

两人合作开发了变分自编码器VAE,相关论文于今年获得ICLR首届时间检验奖。

Durk Kingma于2018年离开OpenAI,做了一段时间天使投资人,后加入谷歌大脑,再后来被合并进了Google DeepMind。

这次他加入Anthropic将主要在荷兰远程办公,没有透露他将具体加入哪个团队或负责哪部分工作。

总之OpenAI变得不像以前的自己,但隔壁Anthropic越来越像以前的OpenAI了

还有人提出,如果去年11月奥特曼真的下台了,OpenAI现在会不会更好呢?

健康的公司,有优秀的CEO,不会用报酬威胁员工签封口协议,也不会有高管辞职,更不会有那么多丑闻。

奥特曼聪不聪明

OpenAI发布

https://openai.com/index/introducing-the-realtime-api/

https://openai.com/index/introducing-vision-to-the-fine-tuning-api/

https://openai.com/index/api-prompt-caching/

https://openai.com/index/api-model-distillation/

参考链接:

[1]https://x.com/swyx/status/1841262588447146133

[2]https://x.com/GregKamradt/status/1841266096277696742

[3]https://x.com/dpkingma/status/1841134573595312344

[4]https://x.com/NickADobos/status/1841167978085433351

[5]https://x.com/dicnunz/status/1841176999773262031

[6]https://fortune.com/2024/10/01/openai-sam-altman-mira-murati-gpt-4o-o1-chatgpt-turbulent-year/

[7]https://www.businessinsider.com/mira-murati-exits-openai-venture-capitalist-startup-2024-9


返回网站首页

本文评论
中国移动 5G 消息终端新增 Hi nova 10,该手机还未发布「华为nova系列的5g手机」
IT之家 8 月 22 日消息,中国移动官方发布了最新支持 5G 消息终端型号,截至 8 月 17 日,支持 UP2.4 的终端机型共 137 款,本次新增 Hi nova 10 手一款。除了三星 (S20 系列起)、...
日期:09-19
realme真我GT5 Pro曝光:后置居中大圆镜头,设计“很影像旗舰”_真我gt5g
近日,关于realme真我新机GT5 Pro的消息不断传出。据透露,该机将搭载骁龙8 Gen 3处理器和潜望镜头,并采用居中大圆镜头设计的素皮版本。同时,真我GT5 Pro在影像方面也有所升级,配...
日期:10-17
嫦娥六号带回的月背快递成功签收:官微宣布抽送月球陨石小颗粒
快科技6月27日消息,日前,回收后的嫦娥六号返回舱安全运抵北京,并举行了开舱活动,成功签收了月背土特产”快递。嫦娥六号月球探测器”官微今天发文宣布要给大家安排土特产”,关注...
日期:06-28
温致科技受邀出席“人才驱动 创新发展”元宇宙与数字医疗创新发展论坛
9 月 24 日,由黄浦区人才工作局指导,“中央科创区”区域化党建联席会议、上海黄浦科创集团有限公司主办的第三届门楣之光·黄浦人才周系列活动--“人才驱动 创新发展”元宇宙...
日期:09-30
比5G好用10倍 中移动、华为率先完成5.5G验证:万兆时代开始了「华为5g速率可以达到多少」
5G网络全球商用已经进入第四个年头了,网速超过1Gbps,国内还建成了全球最大的5G网络,再往后就要推5.5G网络了,华为之前表示它会比5G好用10倍,而中移动日前成功验证5.5G,速率达到了1...
日期:04-05
一加concept one「一加 Ace 3越级影像,助你定格新年新光景」
中国人的年,是每一个家庭团圆的时刻,也是美好瞬间的见证。一台具有强大影像的手机,让我们能够更清晰地定格这些温馨时刻,记录下新年的喜悦和欢笑。一加 Ace 3携手为新年的每个瞬...
日期:02-07
5G演进标准R16落地,5G商用迎来重大进展_5G R16标准Ready 展锐联合联通率先完成5G端到端技术验证
  【环球网智能报道 记者 张阳】5G可以说是当前最热门的词汇之一,大街小巷人人都在谈论5G,甚至不少人都已经换用了5G手机,享受到了5G带来的高速率。但是从早期声势浩大的宣...
日期:07-17
Chrome内存_Chrome 89 稳定版开放下载:降低内存和 CPU 占用率,支持 NFC
  3 月 3 日消息 昨日谷歌正式开放 Chrome 89 稳定版的下载。这次更新主要是修复 bug 和增加一些新功能,比如继续降低内存和 CPU 占用率,增加 NFC 支持等等。   谷歌在...
日期:07-16
有望很快发布 Infinix,GT 20 Pro通过了多项认证_in版gt2
来源:中关村在线第十届创新创业大赛科技消息】自去年8月Infinix GT 10 Pro发布以来,该品牌一直在为迭代做准备。近日,好消息传来,新机已经顺利获得了一系列认证,包括TUV、EEC和Wi...
日期:03-06
深圳北站可以打飞的了!包机9800元起:可坐6人_深圳北站有飞机吗
快科技6月28日消息,今天上午,深铁集团携手东部通航合作共建的中国首个低空 轨道”空铁联运项目在深圳北站枢纽东广场正式开航,向市民提供深圳空铁交通一站式接驳服务。据悉,深圳...
日期:06-28
6年6个一等奖!为何站上科技高地的总是海尔智家?_海尔智家是做什么的
  坚持科技是第 一生产力,这是二十大报告中的重点内容。在国家政策的指导下,山东省也加强了科技创新布局,为区域经济的高质量发展提供重要支撑。   6 月 20 日, 2022 年度山...
日期:06-20
马斯克与女高管所生双胞胎曝光:体外受精,没有恋爱关系
马斯克北京时间9月7日,知名自传作家沃尔特·艾萨克森(Walter Isaacson)为特斯拉CEO埃隆·马斯克(Elon Musk)撰写的自传即将出版。周三,艾萨克森发布了一张照片,曝光了马斯克与...
日期:09-07
开心网赢了官司输了市场 “真假开心网”尘埃落定_真假开心网案尘埃落定
  人人网利用“假开心网”成功狙击了开心网,减缓了开心网迅速扩张的势头,并在IPO上占得先机,这背后不容忽视的是资本的力量。   4月15日,人人网正式递交IPO申请,计划5月登陆...
日期:07-27
10月旗舰大乱斗!华为Mate 70迎战骁龙8 Gen4/天玑9400旗舰_2023年华为mate70
快科技7月11日消息,博主数码闲聊站爆料,天玑9400终端和骁龙8 Gen4终端都将在10月登场,分别由vivo和小米首发。同期亮相的还有华为Mate 70系列,其它品牌也将在10月份推出年度旗舰...
日期:07-11
联想家悦ir358「联想家悦ir358电脑配置」
是一款智能家居控制器,它可以将家中的各种家电和设备进行联网控制,轻松实现智能化生活。接下来,本文将从产品特点、功能应用以及用户反馈三个方面对进行介绍。产品特点的外形设...
日期:05-29
联想erazer_联想erazer z500参数
是联想推出的一款游戏电脑品牌,尤其适用于喜欢玩游戏的玩家。此品牌产品结构紧凑、性能稳定、外形设计迷人等特点一直深受消费者的青睐。下面我们从性能、外观和游戏体验三个...
日期:05-31
自研千亿参数!360智脑获工信部信通院认证:国内首个可信AIGC大模型
快科技6月12日消息,360智脑大模型应用发布会将于6月13日在北京举行,这是360自研千亿参数大语言模型,已具备认知智能通用大模型能力。发布会前夕,360智脑的360GPT-S2-V8型号产品...
日期:06-12
极空间私有云T2 随身数据魔盒亮相IFA展,便携式NAS成为出差必备神器
随着2024年IFA展的盛大开幕,全球目光再次聚焦于柏林,来自世界各地的顶 尖科技产品与解决方案汇聚一堂,展示了消费电子行业的最 新趋势与创新成果。展会期间,无数创新技术在这里...
日期:09-13
国家邮政局:国庆假期全国共揽投快递包裹超41亿件_国家邮政局:双11当天6.75亿件快件
10月8日 消息:国家邮政局公布数据称,10月1日至7日,全国邮政快递业运行安全平稳,共揽收快递包裹21.35亿件,与2021年同比增长7.23%;投递快递包裹19.67亿件,与2021年同比增长2.61%。...
日期:10-09
商务部:“十四五”电子商务发展规划将于近期发布(商务部 十四五规划 电子商务)
  9 月 2 日消息 据第一财经报道,商务部发言人表示,“十四五”电子商务发展规划正在履行有关内部程序,将于近期发布。规划出台后,商务部将会同相关部门通过多渠道开展宣介工...
日期:03-26