您的位置:首页 > 互联网

GPT-4o深夜炸场!AI实时视频通话丝滑如人类,Plus功能免费可用,奥特曼:《她》来了

发布时间:2024-05-14 15:58:41  来源:互联网     背景:

声明:本文来自于微信公众号 量子位(ID:QbitAI),作者:梦晨 克雷西,授权转载发布。

不开玩笑,电影《她》真的来了。

OpenAI最新旗舰大模型GPT-4o,不仅免费可用,能力更是横跨听、看、说,丝滑流畅毫无延迟,就像在打一个视频电话。

现场直播的效果更是炸裂:

它能感受到你的呼吸节奏,也能用比以前更丰富的语气实时回复,甚至可以做到随时打断。

GPT-4o里的“o”是Omni的缩写,也就是“全能”的意思,接受文本、音频和图像的任意组合作为输入,并生成文本、音频和图像输出。

它可以在短至232毫秒、平均320毫秒的时间内响应音频输入,与人类在对话中的反应速度一致。

这还是一份给所有人的大礼,GPT4-o与ChatGPT Plus会员版所有的能力,包括视觉、联网、记忆、执行代码、GPT Store……

将对所有用户免费开放!

(新语音模式几周内先对Plus用户开放)

在直播现场,CTO Murati穆姐说:这是把GPT-4级别的模型开放出去,其实她还谦虚了。

在场外,研究员William Fedus揭秘,GPT-4o就是之前在大模型竞技场搞A/B测试的模型之一,im-also-a-good-gpt2-chatbot。

无论从网友上手体验还是竞技场排位来看,都是高于GPT-4-Turbo级别的模型了,ELO分数一骑绝尘。

而这样的超强模型也将提供API,价格打5折,速度提高一倍,单位时间调用次数足足是原来的5倍!

追直播的网友已经在设想可能的应用,可以替代盲人看世界了。以及确实感觉比之前的语音模式体验上强上不少。

鉴于之前不少人就已经和ChatGPT语音模式“谈恋爱”了,有大胆想法的朋友,可以把你们的想法发在评论区了。

总裁Brockman在线演示

知道OpenAI发布会为什么定在谷歌I/O前一天了——打脸,狠狠打脸。

谷歌Gemini发布会需要靠剪辑视频和切换提示词达成的伪实时对话效果,OpenAI现场全都直播演示了。

比如让ChatGPT在语言不通的两个人之间充当翻译机,听到英语就翻译成意大利语,听到意大利语就翻译成英语。

发布会直播之外,总裁哥Brockman还发布了额外的5分钟详细演示。

而且是让两个ChatGPT互相对话,最后还唱起来了,戏剧感直接拉满。

这两个ChatGPT,一个是旧版APP,只知道对话,另一个则是新版网页,具备视觉等新能力。(我们不妨取Old和New的首字母,分别叫TA们小O和小N)

Brockman首先向小O介绍了大致情况,告诉她要和一个拥有视觉能力的AI对话,她表示很酷并欣然接受。

接着,Brockman让她稍作休息,并向小N也介绍情况,还顺带展示了小N的视觉能力。

只见打完招呼后,小N准确地说出了Brockman的衣着打扮和房间环境。而对于要和小O对话这件事,小N也感到很有趣。

接下来就是小O和小N相互对白的时间了,TA们依然是从Brockman的衣着开始聊起,小O不断提出新的问题,小N都一一解答。

接着,他们又谈论了房间的风格、布置和光线,甚至小N还意识到了Brockman正站在上帝视角凝视着TA们。

如果你看了这段视频就会发现,画面中出现了一个女人在Brockman身后做了些恶搞的手势。

适合30岁用的护肤品牌有哪些平价

这可不是乱入,是Brockman和女人串通好,专门给小N设计的一道“考题”。

就在小O和小N聊的正开心的时候,Brockman选择加入,直接问有没有看到什么不正常的地方。

结果是小N直接识破了Brockman的小伎俩,直接复述出了女人在他身后做小动作的场景,小O听了之后直接感叹原来在这里享受乐趣的不只有我们两个。

Brockman把这句话当成了夸赞,并对小O表示了感谢,还愉快地加入了TA们的对话。

之后是最后也是最精彩的部分,在Brockman的指挥下,小O和小N根据刚才聊天的内容,直接开启了对唱模式。

只过了简单几轮,衔接地就十分密切,而且旋律悠扬,音色也是和真人毫无二致。

最后视频以Brockman唱出的一句Thank you结束,在视频外的推文中他还透露新的语音对话功能将在数周内向Plus用户开放。

端到端训练,一个神经网络搞定语音文本图像

正如奥特曼在发布会前所说,GPT-4o让人感觉像魔法一样,那么它是如何做到的呢?

非常抱歉,这次非但没有论文,连技术报告也不发了,只在官网Blog里有一段简短的说明。

在GPT-4o之前,ChatGPT语音模式由三个独立模型组成,语音转文本→GPT3.5/GPT-4→文本转语音。

我们也可以让旧版ChatGPT语音模式自己讲一下具体是怎么个流程。

支付宝汽车充电

这样一来,整个系统的延迟足足有2.8秒(GPT-3.5)和5.4秒(GPT-4),而且丢失了大量的信息,它无法直接感受音调、多个说话者或背景噪音,也无法输出笑声、唱歌声,或表达情感。

GPT-4o则是跨文本、视觉和音频端到端训练的新模型,这意味着所有输入和输出都由同一个神经网络处理。

在语音翻译任务上,强于OpenAI专门的语音模型Whisper-V3以及谷歌和Meta的语音模型。

harmonyos 2.0桌面

在视觉理解上,也再次反超Gemini1.0Ultra与对家Claude Opus

虽然技术方面这次透露的消息就这么多了,不过也有学者评价。

一个成功的演示相当于1000篇论文。

One More Thing

除了OpenAI带来的精彩内容之外,也别忘了北京时间5月15日凌晨,谷歌将召开I/O大会。

到时量子位将继续第一时间带来最新消息。

另外根据网友推测,GPT-4o这么强,全都免费开放了,这是劝大家不续订ChatGPT Plus了的意思吗?

那肯定不是啊~

鉴于OpenAI春节期间在谷歌发布Gemini1.5Pro后半小时左右用Sora狙击了一把,明天OpenAI还有新活也说不定呢?

直播回放

https://www.youtube.com/watch?v=DQacCB9tDaw

苹果12pro溢价最新消息


返回网站首页

本文评论
国人抢疯!多款降价iPhone现货被抢空是真的:苹果降价狠 14系列降千元
昨天我们报道了,第一波双11活动开始后,用户就各种买买买,特别是苹果,多款降价iPhone现货被抢空更是夸张。晚8点一过,降价后的iPhone、AirPods Pro 2、iPad Air 5等多款产品现货均...
日期:11-02
年轻人流行敲木鱼:APP登免费榜第2 手工耿做了一款自动版_敲木鱼的软件
最近,年轻人玩起了在线敲木鱼,无论遇到什么烦心事,随时在线上敲木鱼平静心情,成了不少网友的修炼”方式。有意思的是,这种新的修行”方式直接把一款APP送上了App Store排行榜第二...
日期:10-17
iPhone」-15将得到大量预订 「分析师预测「苹果15号发布」
据外媒报道,苹果即将在下周三凌晨1点开始的秋季新品发布会上发布iPhone 15系列智能手机,并于周五开始接受预订,随后一个周的周五开始发货。iPhone 15系列的需求备受关注,分析师...
日期:09-10
实拍!小米汽车SU7三款配色正式亮相:海湾蓝一眼惊艳_小米汽车配置
快科技12月28日消息,就在刚刚,大家期待已久的小米汽车SU7实车首发亮相,提供海湾蓝、橄榄绿、雅灰三款配色。主打的是海湾蓝配色,据说取自海平面60米以下的颜色,非常特别。从实车...
日期:12-28
F团央视广告片深化“放心团购 品质生活”
  “放心团购,品质生活,F团放心团”。这样的一则广告片,在14日赫然出现在了央视二套《第一时间》的节目时段中。据悉,这是中国最大的品质生活团购网站F团首条央视广告。青春...
日期:07-26
特斯拉Q2财报「小鹏公布 Q2 财报,对抗特斯拉 Model Y 车型明年到」
2022 年 8 月 23 日,小鹏汽车公布 2022 年 Q2 财报,而数据显示第二季度车型的总交付量为 34422 辆,连续四个季度成为新势力销冠。营收 74.36 亿人民币,同比增长 97.7%。然而第二...
日期:09-20
微信表情搜索在哪「微信宣布上线表情搜索、定闹钟等实用功能」
11月6日 消息:今日午间,微信官方发布文章,介绍了一系列新功能。微信上的扣费服务关闭了怎么重新开启?其中,安卓和iOS新版本中均可使用的独立发送按钮功能。这一新功能将使微信...
日期:11-07
两个小镇青年,婚后一起揽获诺奖!这对夫妇诠释了真正的科学浪漫
▎药明康德内容团队编辑编者按还有半个月,万众瞩目的诺贝尔奖就将陆续揭晓各个奖项的得主。与往年一样,药明康德内容团队也将第一时间为读者朋友们报道诺奖的进展。现在,让我们...
日期:09-16
苹果手机图片「苹果手机图片传输到电脑上」
苹果手机自上市以来,一直以来以它的品牌和高性能而闻名全球。它的设计以及图片质量也是苹果手机广受欢迎的原因之一。苹果手机的图片品质具有很高的清晰度和真实性,因此很多人...
日期:06-04
看“厂妹”直播,4亿打工人的求职新方式「找个厂妹怎么样」
声明:本文来自于微信公众号 电商在线(ID:dianshangmj),作者:沈嵩男,授权转载发布。短视频、直播电商,开始生长出预料之外的业态——线上蓝领招聘。线上投简历、面试,包办入职。对...
日期:09-30
腾讯公益发起人陈一丹2021新春贺辞(陈一丹腾讯创始人简介)
  各位爱心网友、公益伙伴:   过年好!   岁月如轮,万象更新。值此新春佳节之际,腾讯公益再一次带着感谢、祝福和对新一年的美好期许而来。   过去的农历庚子年,是尤为...
日期:07-16
第二十届增值电信及虚拟运营年会在北京成功举办_2021年中国电信增值大会论坛
通信世界网消息(CWW)11月15—16日,第二十届增值电信及虚拟运营年会在北京成功举办。本届年会以“通信新时代,携手向未来”为主题,由中国通信企业协会指导,中国通信企业协会增值服...
日期:12-08
乐视视频:夹缝生存苦亦甜
  今日,乐视视频宣布 App 图标上新,应用标语变为“夹缝生存苦亦甜”。   谈及更改 App 标语时,乐视视频表示,这些年着实体会到了端妃夹缝生存的辛苦,不过也取得了很多突破...
日期:07-18
oppo智能ai通话「OPPO Find X7宣布支持AI通话摘要 通话结束即可一键生成」
1月8日 消息:今日,OPPO官方宣布,Find X7成为首款支持AI通话摘要的手机。用户在通话结束后,只需一键,即可生成摘要,并自动创建待办事项和提醒。此外,OPPO表示,在人工智能领域持续发...
日期:01-08
苹果因新款iPhone双摄像头技术再陷官司,被诉侵犯10项专利(苹果面临70亿美元专利赔偿)
  (原标题:苹果双摄像头iPhone被诉侵犯10项专利)   网易科技讯8月15日消息,据外媒报道,以色列摄像头技术公司Corephotonics日前针对苹果提起诉讼,指控苹果故意在其最新款iP...
日期:11-14
抖音一个送外卖的网红「从本地生活到外卖,抖音又添“一条腿”?」
星巴克上星早餐19元,奈雪的茶咖啡系列9.9元,两杯喜茶经典销冠28元……年货节期间,入驻抖音本地生活的新式茶饮品牌纷纷打起了价格下沉大战。数据显示,星巴克早餐套餐销量高达85...
日期:01-29
微软Windows 7份额超过20% IE份额持续下滑(windows 市场份额)
微软和Google都推出了两款成功的产品:Windows已经超过了20%的份额,而Chrome的份额也达到了两位数。在浏览器市场上,IE8增长强劲,IE9也已推出,IE的份额还是继续探低。Firefox的用...
日期:07-25
谷歌全球副总裁刘允:发力展示广告(刘允 google)
  在通过ICP牌照年审一周之后,低调许久的谷歌开始在国内大规模地公开宣传自己的广告业务。   昨日,谷歌全球副总裁刘允表示,谷歌将逐渐把AdSense、DoubleClick和AdMob等一...
日期:07-23
OpenAI首次跻身胡润世界500强 估值达500亿美元
1月31日 消息:胡润研究院今日发布《2023胡润世界500强》报告,其中首次包括了世界500强中的非国有企业。根据报告,OpenAI以500亿美元的估值首次进入胡润世界500强,而该公司目前...
日期:01-31
1999元!vivo新款机型上架:配置诱人 售价亲民_vivo新款手机2019
近日,vivo官方上架两款新机,分别为vivo Y78(t1)和vivo Y78m(t1),售价均为1999元。这两款机型的配置方面,vivo Y78(t1)提供了皓夜黑、玉瓷青和凤羽金三种颜色,而vivo Y78m(t1)则有皓夜黑和...
日期:10-09