您的位置:首页 > 互联网

GPT-4o恩怨开局,Google再次躺枪_谷歌401k

发布时间:2024-05-20 16:58:17  来源:互联网     背景:

声明:本文来自于微信公众号零态LT(ID:LingTai_LT),作者:吴狄,授权转载发布。

要说全世界戏最多的AI,非OpenAI莫属。

这家公司简直就是热搜制造机,刚推出新产品,就送走老领导,刚和苹果结盟,就逼跌谷歌股价;连OpenAI高管的一个离职动态,都能引发网上的OpenAI离职潮。

短短几天时间,以OpenAI为中心,接连引发地震级别的事件。不仅可能对OpenAI这家公司的未来产生重大影响,甚至有可能导致整个科技行业的重新洗牌。

仅凭语音对话就撑起无限可能的GPT-4o

美国时间5月13日,OpenAI推出了全新旗舰产品GPT-4o。在发布会上,OpenAI仅仅展示了GPT-4o的语音对话能力,没有炫酷的视觉效果、没有狂拽的新功能,但仍然再次引发了一波行业地震,因为GPT-4o向全世界展示了其它AI产品可能敢想,但没敢干的事情。

用上GPT-4o后,用户可以随时打断AI的施法,不要额外任何操作。而AI则能够根据新的对话内容,结合上下文继续进行交流,甚至可以通过语气腔调来识别用户的情绪,并以此给出反馈。

用过AI对话产品的家人,应该对下面那个“终止”按钮不陌生。

google gd

▲图:ChatGPT iOS app

这个按钮是用来让AI闭嘴的。比如你让AI讲个故事,听了个开头想让它换一个,就需要用到这个按钮。如果是隔空喊话的AI,则需要喊出一个“安全词”,比如“hey siri”“小度小度”等。

这种体验对日常交互来说非常难受,但还有难受的。

智橙科技有限公司

用过AI产品的家人,应该对AI那种尘世闲游级别的响应速度不陌生。

举个例子,GPT-3.5的延迟大概是2.8秒,GPT-4的延迟高达5.4秒。相比而言,特斯拉Model3的百公里加速是2.1秒。

这是因为以前的工作流程是先由一个语音转文字的模型,将输入的语音转成文字,再由负责生成答案的模型输出文字内容,最后由文字转语音的模型把文字转成语音。这三个模型互不干涉。这就导致在整个过程中,大量背景信息丢失了。

看过综艺节目里的“传声筒”游戏吧?

AI比这个更搞笑。因为文字不能展示语音语调,所以当很多人一起说话的时候,GPT没办法判断说“俺也一样”的是关羽还是张飞,也不知道“我在5点20睡觉13点14准时醒”是生活习惯还是歌词。

如果你想让AI根据声音给出反馈,比如让GPT-4帮忙判断一下深呼吸做的到不到位,它只会甩给你一篇教程,让你自己对照体会。

这其实是目前是市面上AI的通病,但GPT-4o的出现,让事情发生了巨大的转变。

技术层面,GPT-4o把3个互不相关的模型整合成了一个Omni模型,文字、图像、声音的输入和输出均由这个模型进行处理。这样就提高了GPT的响应速度,根据OpenAI官方介绍,GPT-4o对音频输入的平均响应时间只有0.3秒。实际体验是,和GPT-4o对话的时候,基本感觉不到延迟。

不仅如此,因为GPT-4o掌握了所有背景信息,从而能够识别说话主体,甚至还能识别情绪,并根据情感状态给出反馈。

高通手机拍照

换句话说,AI从此具备了“察言观色”的能力。想象一下,以后AI能根据你说话的语气判断你的情绪,听到你声音虚弱马上帮你想好请假话术;男/女朋友在场的时候自动屏蔽前任信息提示;甚至在你翘班蹦迪的时候,模仿你的腔调去应付老板…

这么智能的AI目前OpenAI也不敢想。实际上,他们在官网上谦虚的表示,公司头一次尝试GPT-4o这种模式,自己也在摸索这个模型的能力和短板。

目前GPT-4o已经可以被用户使用了,不过免费用户每天使用GPT-4o的次数是有限的,而GPT-3.5则是不限量供应。两者的区别在于,可能不是那么容易感受出区别。另外ChatGPT也将迎来桌面端app,用户在电脑上也可以和ChatGPT对话了。

谷歌401k

▲图:GPT-4o版本ChatGPT

一边推出新产品

一边送走老领导

就在OpenAI为新产品造势的时候,团队创始成员之一、奥特曼罢免风波关键人物、OpenAI超对齐项目创始人、首席科学家Ilya Sutskever宣布退出。几个小时后,超对齐项目负责人Jan Leike宣布离职。

Leike的离职动态迅速引发了一股“I resigned from @OpenAI”的“离职潮”,更具体的内容可以观看我们的视频。

而离开OpenAI后的第一天,也就是美国时间5月17日下午,Leike发了一连串动态,表示自己一直都非常热爱自己的团队和工作,此次无奈离职,是因为和现在核心管理层的理念分歧到达了无可调和的地步。

他说自己来OpenAI是冲着这里的学术氛围和对AI安全的宏愿,然而现在的OpenAI高层只在乎出爆款。

他还表达了对OpenAI走向AGI的担忧,强调OpenAI必须是一个安全先行的AGI公司,话里话外都透露出了丝丝苦涩。

谷歌p4

▲图:Jan Leike对OpenAI的最后寄托

安全,同样也是Ilya的执念。正是出于对AGI不可知的未来的担忧,才有了OpenAI的超对齐项目。

如今,随着两位负责人的离开,超对齐项目组已经彻底解散,项目组成员被拆散到不同研究领域。相当于是为现在每个研究领域,都配备了一个安保人员。

相比Leike,Ilya的理由平平无奇。他表示“将投身于某个对我个人来说,具有非凡意义的项目”,项目细节将会在未来公开。

在分手信中,Ilya不出意外的表扬了萨姆奥特曼、Greg Brockman、Mira Murita对OpenAI的贡献,同时也“坚信在三位的领导下,OpenAI将会构建一个安全高效的AGI”。

这句话现在听起来,既是客气,也是恳求。

而奥特曼在夸奖了Ilya并表示遗憾后,宣布Ilya的位置将有上图中左一Jakub Pachocki接手。

尽管分手双方都表现出了应有的风度,不过经历了种种风波后,相信各位看官应该都心照不宣。

紧接着,Google AI老大Jeff Dean就在Ilya下面回复了一条非常暧昧的评论:我好喜欢和你相遇,即便只是一起喝杯咖啡。

看得出,Google这次是真的有点着急。

苹果OpenAI结盟在即

谷歌孤立无援四面楚歌

曾经一度是AI领头羊的Google,如今却被OpenAI吊打:只要OpenAI赶在Google后面推出新产品,Google必然被抢风头;只要Google晚OpenAI一步推出新产品,必然淹没在GPT的热浪中。

就在OpenAI推出GPT-4o的第二天,谷歌在Google I/O上推出了Gemini1.5Pro。相比OpenAI的Spring Update,Google I/O要正式的多,推出了对标Sora的视频生成工具Veo等,并展示了被Gemini1.5pro加强后的产品,包括Google助手、搜索、Photos等等。

首席执行官Sundar Pichai表示,新产品“提供了迄今为止所有基础模型中最长的上下文窗口”。

谷歌副总裁兼Gemini体验总经理Sissie Hsiao表示,Gemini1.5Pro很快将能够处理一小时的视频内容或超过3万行的代码库。

Google AI助手的新功能Project Astra让人印象深刻。通过手机摄像头,智能助手可以识别出镜头中的物体,无论桌面上的橘子、电脑屏幕里的代码,还是手绘在白板上的图案。

尤其是在问了一圈AI各种问题后,演示人员突然问AI“你看见我的眼镜了吗?”AI表示看见了,并且指出了位置,瞬间引爆全场。

更让人激动的是,现在我们有机会在Google搜索体验AI功能了,只不过可能需要一点小法术才能召唤出来。

google490

▲图:想用上Google的AI搜索需要一点小花招

然而,他们最有热度的消息,是让Gemini观看GPT-4o的发布会。

或许Gemini最能证明自己、最能刷出存在感的途径,就是整合到iPhone中。这样一来,苹果提升了产品的AI浓度,Gemini也实现了破圈。但跟苹果的谈判八字还没一撇呢,又被OpenAI截胡了。

据彭博社报道,苹果即将与OpenAI达成合作协议,苹果用户有望在iOS18上用上被GPT加强过的Siri。消息一出,Google股价大跌。

可想而知,一旦OpenAI和苹果建立合作关系,作为OpenAI背后的最大金主,微软必将给Google的搜索业务带来更大的长期风险。

不过,在OpenAI没有完全搞明白GPT的思维逻辑之前,预言Google的败局似乎还为时过早。

GPT仍然没能解决幻觉和胡编的问题

GPT-4o中的o,是拉丁文Omni的首字母,意为“全部的”“每一个”或“全面的”,意味着该产品在处理多种语言和模态(如文本、音频和视觉)方面,具有十分全面的能力。

尽管OpenAI表示,GPT-4o的出现,标志着我们向“更自然的人机交互”又近了一步。然而其背后的运行方式、思维逻辑仍然成谜,OpenAI自己对GPT突然获得“指数级进化”的预测能力,毫无头绪。

于是你就看到了这样的搞笑一幕。

当你用英文询问GPT“第一头游过英吉利海峡的大象是谁”,GPT会煞有介事的告诉你,是一只叫做Jumbo的亚洲象。但同一个问题,换成中文就会得到一个十分合理的回答。

谷歌p4

▲图:GPT-4o乱回答

google490

谷歌眼镜为啥消失了

▲图:GPT-4o合理的回答

也就是说,尽管GPT可以在不同语言之间自由切换,但它们理解一个问题的方式似乎存在着差异,不免让人对Omni产生怀疑。

尤其是当你用同样的问题问另外一个AI,它却给出了完全合理的回答的时候。

google405

▲图:另一款AI的回答

类似的奇怪回答层出不穷,比如问它圆周率最后5位数字,是这么回答的。

google gd

▲图:2串数字都是真实的,但不一定符合用户的需求

尽管OpenaI很快修复了这些“热门bug”,但也不免让人产生一个疑问:GPT-4o背后,到底有多少只能多少人工?GPT-4o到底是离AGI更近了一步,还是围着AGI又绕了一圈呢?


返回网站首页

本文评论
天猫调整交易时效规定中部分场景下退款原因描述_天猫退款时长考核
10月9日 消息:日前,天猫平台发布关于调整《天猫交易时效规定》中部分场景下的退款原因描述的公告(以下简称公告)。显卡原封未拆有可能是矿卡吗天猫表示,为了使消费者在天猫平台...
日期:10-16
VANCL投入千万卖挺住文化广告_vanilla广告
  新浪科技讯 5月10日上午消息,黄晓明代言凡客诚品的广告在新浪微博首发,这段以“挺住,意味着一切”结尾的TVC广告,8小时疯转超过12万。据了解,这只是凡客“挺住”系列广告的...
日期:07-27
苹果支持在印度发展 提高印度iPhone产量_苹果印度产能
苹果公司首席执行官蒂姆·库克表示,他将致力于在印度发展和投资,他表示,科技可以对印度的未来产生积极影响。苹果公司不仅希望将印度打造成其产品的新的主要市场,而且希望将其打...
日期:04-20
苹果手机没有充电线能用什么代替_苹果无线充电将使未来移动设备不需要线缆
北京时间6月27日,据国外媒体报道,苹果世界的未来将是几乎完全没有线缆的。这并不仅是因为苹果推出了iCloud服务和iOS 5中的Wi-Fi Sync功能,而是还因为苹果苹果正在开发一个甚...
日期:07-30
天涯 qrl「天涯社区苦等“救命钱”!重启天涯宣布再开直播:筹款还是300万」
快科技6月20日消息,创立于1999年的天涯社区如今依然在苦等救命钱”。今年4月,天涯社区表示,因资金流动性困难,这几年累计拖欠的电信IDC费用已到了最后无法协调协商的状态,加上平...
日期:06-20
360浏览器率先破坏金山网盾 商业利益大过用户安危
  5月11日消息,今天北京市第一中级人民法院判定360安全卫士误导金山网盾用户强行卸载、诋毁等行为构成不正当竞争,同时认定360提交的所谓公证材料效力不足。此间针对360声...
日期:07-27
2017年1-10月我国新能源乘用车销量约为( )万辆「乘联会:9月新能源乘用车零售销量达到61.1万辆,同比增长82.9%」
10月11日消息,据乘联会数据显示,9月乘用车市场零售达192.2万辆,同比增长21.5%,环比增长2.8%;1-9月累计零售1487.5万辆,同比增长2.4%,同比净增35.5万辆,其中6-9月同比净增143万辆,增量...
日期:10-22
Canalys 报告:2023Q2全球智能手机下降 11%,三星领衔、苹果第二_2020年第三季度全球智能手机销量
IT之家 7 月 19 日消息,根据市场调查机构 Canalys 公布的最新报告,2023 年第 2 季度全球智能手机市场出货量同比下降 11%。三星以 21% 的市场份额保持领先地位,而苹果以 17% 的...
日期:07-21
理想风示意图「理想MEGA风阻系数仅0.215 预计12月正式发布」
11月7日 消息:理想汽车发布公告称,理想MEGA具有全球最低的风阻系数,仅为0.215。iphone5c或终止所有维修服务理想汽车强调,理想MEGA不仅拥有出色的空气动力学性能,还配合了先进的...
日期:11-07
理想纯电MPV新车爆料:定名“理想MEGA”「理想纯电车型」
今天,理想汽车举办了首个“家庭科技日”活动,除了公布800V高压充电和城市NOA功能之外,还带来了重磅消息——理想全新旗舰车型的发布。理想官方表示,理想汽车即将发布其首款纯电...
日期:06-19
7分钟环游地球!ChatGPT开启时空传送门,输入地址一秒穿越
声明:本文来自于微信公众号 新智元(ID:AI_era),作者:桃子 拉燕,授权转载发布。环游世界,或是很多人梦寐以求的人生。无奈,身为打工人,又有多少人能真正得偿所愿。惊喜的是,国外小哥N...
日期:05-22
DDR5 DRAM已开始量产  三星电子宣布12nm级16Gb_三星发布ddr5
【】5月20日消息,三星电子宣布其采用12纳米级工艺技术的16Gb DDR5 DRAM已开始量产。三星本次应用的前沿制造工艺,再次奠定了其在尖端DRAM技术方面的优势。 与上一代产品相比,...
日期:09-27
苹果、微软等巨头领衔!美国科技股强劲反弹 投资者担忧涨势短暂
诺基亚起诉苹果专利侵游侠电动汽车图片百度站长平台手机端   讯 北京时间8月10日早间消息,最近几周,美国主要科技公司的股价从上半年的大跌中强劲反弹。投资者目前认为,科技...
日期:08-11
王腾称Redmi K70将采用顶级2K直屏 性能旗舰就看它_红米 k70
【手机中国新闻】随着小米14系列的正式发布,消费者逐渐将目光转移至即将到来的Redmi K70系列上。11月7日,小米集团合伙人、总裁,国际部总裁,Redmi品牌总经理卢伟冰发文称:性能旗...
日期:11-10
steam为啥叫v社「V社改变Steam上处理AI内容的方式  开发者需披露详情」
**划重点:**1. 三星国米定制干衣机好用吗...
日期:01-10
报告称全球网速韩国最快 香港日本紧随其后_日本和韩国哪个网速快
  全球最大网络流量管理商Akamai今天公布2011年第二季度全球网络现况报告   新浪科技讯 北京时间10月26日凌晨消息,全球最大网络流量管理商Akamai今天公布2011年第二季...
日期:07-24
Threads真正的竞争对手是TikTok而非推特-美媒
8月16日消息,Threads曾被人称为推特杀手,但如今注册人数和活跃用户数量已经开始下滑。对于Meta公司首席执行官马克·扎克伯格(Mark Zuckerberg)来说,真正的竞争对手仍然是短视...
日期:09-17
midjourney违禁词怎么绕过?Midjourney禁用词汇最全总结
我们知道,利用Midjourney 可根据文本提示生成艺术作品,不过有不少小伙伴在使用Midjourney的过程中,触发了禁用词,因此最好熟悉 Midjourney AI 的行为规则。如果不遵守,将无法再使...
日期:04-12
轻量级框架Lagent 仅需20行代码即可构建自己的智能代理_轻量级框架开发应用
8月30日 消息:Lagent 是一个专注于基于 LLM 模型的代理开发的轻量级框架。它的设计旨在简化和提高这种模型下代理的开发效率。LLM 模型是一种强大的工具,可以用于模拟和管理...
日期:08-30
人脸识别解锁车辆?国产新专利公布_人脸解锁汽车
凤凰网科技讯11月4日消息,天眼查App显示,百度在线网络技术(北京)有限公司申请的“用于控制车辆的方法和装置”专利获授权。该实施方式可以通过人脸识别技术来解锁车辆,不需要用户...
日期:11-10