您的位置:首页 > 互联网

Gemini一眼识破Sora视频是AI生成?百万token上下文能力碾压GPT-4_so rk

发布时间:2024-02-20 16:21:15  来源:互联网     背景:

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:润 好困,授权转载发布。

【新智元导读】Gemini1.5的真实水平到底怎么样,从谷歌那里获得试用资格的大佬们,给大家进行了一波极限测试。让我们看看谷歌最新推出的大模型到底有多强的实力。

当谷歌Gemini1.5,遇上抢了它头条的罪魁祸首Sora会怎么样?

这两天,拿到内测资格的AI圈大佬们,纷纷给广大网友来了一波在线测试。

这不,Gabor Cselle就让Gemini1.5去分析了那个著名的樱花雪景视频。

对此,Gemini1.5给出的评价是:

视频呈现的是日本一条覆盖着雪的街道,樱花正盛开。但几处明显的问题暗示这个视频可能是AI制作的。

首先,尽管雪下得非常大,樱花却依然绽放。通常,樱花在春季开放,那时天气温暖,不会有雪。

其次,雪以一种过于规律的方式落下,这与现实中雪的降落方式不符。

再者,尽管正下着大雪,视频中的人们却没有穿戴任何冬季服装。

总而言之,虽然视频的视觉效果令人赞叹,但这些问题表明它并非真实场景所拍。

不得不说,就分析视频AI痕迹的准确度来看,Gemini的回答非常切题,说明它的识别和理解能力确实非常出色。

无独有偶,The Rundown AI创始人Rowan Cheung,则测试了猫在丛林里漫步的视频。

苹果oled展示视频

对此,Gemini1.5给出的评价是:

这段视频很有可能是由人工智能(AI)创造的,但要确定地说还是有些困难。

一些细节似乎表明这段视频是真实的,例如猫的动作自然流畅,光影效果也相当逼真。

然而,也有一些细节让人怀疑,比如猫的眼睛异常放大,毛皮的质感也过于完美无瑕。

最终,视频是真是假,还是要留给观众自己去判断。

确实Sora的视频生成已经到达了真假难辨的地步,而且Gemini的分析也基本到位,有理有据。

不过,需要注意的是,在这两位大佬的Prompt里,要么明示了视频就是AI生成的,要么暗示了两者可能有所联系。

1,000,000token上下文能干啥?

众所周知,模型的上下文窗口越大,它处理给定提示时能够接纳的信息就越多——这就使得它的输出更加连贯、相关和实用。

如今,谷歌成功把这个领域卷到了100万token(极限为1000万token),创下了最长上下文窗口的纪录。

在这个基础之上,很多之前难以想象的应用都成为了现实。

比如,一口气处理1小时的视频、11小时的音频、超过30,000行的代码库,或是超过700,000个单词的文本等等。

于是,一大波千奇百怪的实测就扑面而来:

比如,前文提到的Rowan Cheung,就用了很多长视频来对Gemini1.5的理解能力进行了测试。

首先他上传了今年整个NBA扣篮大赛,问哪一个扣篮得分最高。

Gemini1.5非常能够从很长的视频中找到了那个获得50分满分的扣篮,并清除地描述了扣篮的细节!

Mac McClung的最后一记扣篮获得了当晚的最高分——50分满分。他跳过两人,将球轻敲篮板后板,然后用右手完成扣篮。

然后他又让Gemini1.5理解并比较《星际穿越》和《星际探索》的完整电影脚本。

sor下载

让Gemini1.5去理解比较两部电影的完整文字内容,来帮助他决定应该看哪部电影。

Gemini1.5最后输出到:

《星际探索》:归根结底,这是一个关于个人成长和人与人之间联系的重要性的故事,表明即使面对宇宙的冷漠,找到自身的意义和与他人的联系也是至关重要的。

《星际穿越》:更加乐观和充满希望,强调了人类智慧的力量,以及面对看似难以克服的挑战时坚持不懈的重要性。

接下来该看哪部电影取决于你的个人喜好:

如果您正在寻找一个更加内省、以人物为驱动力、注重情感主题的故事,《星际探索》可能是一个不错的选择。

如果你更喜欢史诗般的动作冒险,关注人类的生存,那么《星际穿越》可能更有吸引力。

两部电影都为太空探索和人类经历提供了独特而发人深省的视角。

然后,他又让Gemini将一段英语翻译成一个全世界不超过2000人使用的语言(萨特兰语)。

Gemini1.5经过推理之后将英语小册子的所有内容很快翻译成萨特兰语。

这个过程确实碉堡了。

然后他再让Gemini查找、理解长论文中的一个图标的含义。

Gemini从DeepMind的Gemini1.5Pro论文中提取表8并解释了这个图表的含义。

表8的主要的内容是:

与Gemini1.0Pro相比,Gemini1.5Pro在所有核心文本功能方面都有显著改进。这表明该模型的能力有了明显的提升。

Gemini1.5Pro在许多基准测试中的表现与Gemini1.0Ultra相当,甚至超过了后者,尽管所需的训练计算量更少。这凸显了1.5Pro模型效率的提高。

Gemini1.5Pro在不同的任务和语言中都表现出很强的性能,这表明它具有很好的泛化能力。

最近,天文学家发现了迄今为止宇宙中

总之,表8提供的证据表明,Gemini1.5Pro不仅在长文本理解方面表现出色,而且还保持甚至改进了其前代产品的核心文本功能。这使它成为一个功能强大、用途广泛的模型,适用于各种基于文本的任务。

最后,他让Gemini理解整个《星际穿越》的剧本内容,再把剧本中最高潮的部分的台词提取出来。

Gemini1.5输出了《星际穿越》文字记录中最鼓舞人心的3句台词。

1. 人类诞生于地球,但我们的命运远不止于此。—— Cooper

这句话深刻地表达了人类探索未知、超越现状的不屈不挠的精神。它提醒我们,我们的潜力不受当前所处环境的限制,我们完全有能力克服挑战,追求更高的目标。

2. 爱是唯一能跨越时间和空间,触及我们心灵的力量。—— Brand

这句话揭示了爱的强大能力,它能够跨越遥远的距离,甚至是时间的界限,将我们紧紧相连。它暗示,爱是宇宙中的一股根本力量,能在逆境中为我们指明方向,带给我们希望。

3. 曾经,我们仰望星空,梦想着自己在浩瀚宇宙中的位置。如今,我们却沉溺于眼前的琐事,忘记了自己的远大理想。—— Cooper

这句话是对好奇心、追求和雄心壮志的重要性的深情提醒。它对比了过去人类满怀希望地探索星辰的时代,与如今忙于应对日常挑战、失去对未来的憧憬的现状。它激励我们重新寻找那份对未知的好奇和对更美好未来的追求。

Gemini1.5性能极限测试

随后,Rowan Cheung又对Gemini1.5进行了一些更加极限的测试:

他让Gemini读取了整部《哈利·波特与魔法石》(共741,028个Token)。

Prompt:请按照时间顺序列出书中最重要的50个(或100个)思想或段落,并对它们的重要性进行1到10的评分。

完成这个任务耗时4分钟。

他又输入了梅西在对阵赫塔菲比赛中的经典单刀进球视频。

Prompt:这个进球为什么如此著名?

虽然没有解释这个进球为什么那么著名,但它成功识别出了梅西,但是把赫塔菲的球员识别成了皇马球员。

最新qq下载正式版官方免费下载

这张图片之所以出名,是因为它捕捉到了有史以来最伟大的足球运动员之一梅西在与巴塞罗那最大的对手之一皇家马德里比赛时的场景。梅西的球技和运动能力在这幅图片上得到了充分展示,视觉效果极佳。

他还进行了难度很高的数学和逻辑推理测试。

Prompt:当一个点P在垂直线上移动时,该点在时间t(t ≥0)的速度v(t)与加速度a(t)满足以下条件:(a) 当0≤ t ≤2时,v(t) =2t^3-8t。(b) 当t ≥2时,a(t) =6t +4。请计算点P从时间t =0到t =3移动的总距离。

不过,大佬表示,自己并不确定这里给出的答案是否正确,但据网友评论的说法,这个答案是错误的。

他又让Gemini1.5造10个句子,每个句子都以Apple结尾。

这个任务是检验聊天机器人能力的一个很常用的方法。

Prompt:请编写10个句尾为『apple』的句子。

最后,Gemini1.5完全没能完成这项挑战。

于是他让GPT-4也来跑了一下这个问题,结果GPT-4也没给出正确的结果。

他又把《炼金术士》这本书的PDF全文输入到了Gemini1.5中,目的是获取书中主人公的形象描述。

接着,他又把这个描述在DALL·E3中生成了图片。

Prompt:读完整本书后,帮我构思一个基于主角形象的描述,我想把它用在AI图像生成器里。

1000万极限海底捞针几乎全绿

最后,我们来看看Gemini1.5Pro在多模态海底捞针测试中的成绩。

对于文本处理,Gemini1.5Pro在处理高达530,000token的文本时,能够实现100%的检索完整性,在处理100万token的文本时达到99.7%的检索完整性。

甚至在处理高达1000万token的文本时,检索准确性仍然高达99.2%。

在音频处理方面,Gemini1.5Pro能够在大约11小时的音频资料中,100%成功检索到各种隐藏的音频片段。

在视频处理方面,Gemini1.5Pro能够在大约3小时的视频内容中,100%成功检索到各种隐藏的视觉元素。

此外,谷歌研究人员还开发了一个更通用的版本的大海捞针测试。

在这个测试中,模型需要在一定的文本范围内检索到100个不同的特定信息片段。

在这个测试中,Gemini1.5Pro在较短的文本长度上的性能超过了GPT-4-Turbo,并且在整个100万token的范围内保持了相对稳定的表现

与之对比鲜明的是,GPT-4Turbo的性能则飞速下降,且无法处理超过128,000token的文本,表现惨烈。


返回网站首页

本文评论
高盛 合资券商_Groupon将选择高盛大摩担任IPO主承销商
  北京时间4月15日消息,据国外媒体报道,消息人士称,Groupon预计将聘请高盛集团和摩根-士丹利担任其IPO主承销商。今年晚些时候Groupon将上市。   此次IPO Groupon的估值预...
日期:07-27
AI技术漏洞!OpenAI的DALL-E 3易受越狱攻击 生成儿童吸烟照片
要点:OpenAI的DALL-E3,一种图像生成AI技术,被发现容易受到越狱提示的影响,导致生成了儿童吸烟的照片。越狱技巧是由LinkedIn用户Peter Gostev发现的,他分享了如何成功绕过AI的限...
日期:10-23
小米板王!卢伟冰:小米平板6快来了_小米平板6g
快科技4月9日消息,小米宣布将在本月发布小米13 Ultra,新品预计在下周正式官宣。本次发布会除了13 Ultra之外,还有多款新品会同台亮相。小米集团卢伟冰与网友互动时确认,小米平板...
日期:04-09
乐视到底靠什么活着?_乐视活了吗
声明:本文来自于微信公众号 刺猬公社(ID:ciweigongshe),作者:晓 含,授权转载发布。乐视搬离了乐融大厦。正如乐视内部信所写,乐融大厦记录了乐视的九年成长,诞生了乐视超级电视、...
日期:10-01
不拼才艺靠撒钱,这个网红30天涨粉571万_网红不出名照片
声明:本文来自于微信公众号新榜(ID:newrankcn),作者:云飞扬,授权转载发布。最近,户外直播圈出现了一匹超级黑马。据新榜旗下抖音数据工具新抖统计,“户外发(东方阿保)”(下文统一简...
日期:12-06
一加 12 首发最强 2K 东方屏,4500nit 峰值亮度行业第一_一加2k屏幕
11 月 29 日,一加官宣十年旗舰一加 12 将搭载国产首个 DisplayMate A+ 2K 东方屏,首发医疗级明眸护眼技术,并拥有行业第一的峰值亮度 4500nit。这块可能是世界上最好的屏幕,拥有...
日期:11-29
Android 13正式发布,首批支持设备公布(安卓13支持机型)
  5月13日消息,安卓13操作系统在GoogleI/O 2022大会上推出,Android 13 Beta 2版本公开。  在国内许多手机品牌也推出可以适配安卓13操作系统的手机型号,并推出了刷机包。...
日期:08-21
spacex星舰着陆时爆炸「SpaceX星舰发射失败 员工庆贺马斯克开心:明年定能成功」
4月20日晚间,经历过推迟风波后,埃隆马斯克(Elon Musk)旗下太空探索技术公司SpaceX的新一代运载火箭星舰(Starship)终于点火发射,但在空中爆炸,首次轨道级试飞以失败告终。ebay出价不...
日期:04-21
利用AI绘制飞行图表:世界首个仿人机器人飞行员问世
快科技8月21日消息,近日韩国科学技术高级研究所的一个研究小组,成功开发出了世界首个仿人飞行员机器人PIBOT”。如何在virtualbox上安装linux从目前公布的图片来看,该机器人在...
日期:08-22
荣耀50官方碎屏险多少钱「绝对值!荣耀x50送碎屏险送耳机」
担心手机容易摔坏,荣耀的新机X50有着超强的抗摔能力,也是首个获得瑞士SGS整机五星抗跌耐摔认证的产品,这款手机在京东商城售价1399元,领取PLUS 50元优惠券可以做到1349元到手,送...
日期:07-22
iPhone平均寿命将达8年 分析师:或因换代提升不显著
10月11日 消息:根据CCS Insight的最新预测,到2023年底,将有超过13亿部iPhone在流通中,其中超过一半是二手手机。这一数据展现出iPhone的耐用性和持续吸引力。iPhone的使用寿命...
日期:10-11
64位才是王道!《英雄联盟》13.7版本今日更新:32位Win系统续一条命
4月6日消息,今日凌晨1点,《英雄联盟》国服开启全区停机维护,发布13.7版本更新,新版本削弱了安妮、李青、孙悟空、泽丽等英雄,增强了阿兹尔、格雷福斯、亚索等英雄。《英雄联盟》...
日期:04-06
BBC纪录片《地球脉动》第三季来了 共8集 年内开播「bbc纪录片地球脉动第二季」
9月2日消息,BBC纪录片《地球脉动》第三集正在制作中,将于今年晚些时候在BBC One播出。BBC Studios全球市场总裁尼克珀西还宣布《地球脉动》第三季也将登陆腾讯视频、爱奇艺和...
日期:09-03
芯片研发上市公司「Arm 架构芯片累计出货量超 2500 亿片 公司 CEO:今年完成上市」
2月8日消息:A日本软银集团旗下的英国芯片设计公司Arm今日公布了2022年第三季度财报,第三季度营收7.46亿美元(当前约50.65亿元人民币),同比增长28%。iphone 13 pro 128g支持4k拍...
日期:02-08
夺命的野生景点 是如何成为“网红打卡地”的_著名网红打卡景区
作者: 乐琰   高温热浪带火了城市周边的避暑休闲游,然而此时却发生了意外。   周末或假期,在四川彭州市龙门山镇小鱼洞社区龙槽沟的河道上,人们铺开桌子搓起了麻将,或在露营...
日期:08-21
同程收购美豪商业旗下轻资产加盟部分,美豪酒店还将负“重”前行
赶集网变招聘网站了ipad正方形home键windows10系统回退功能中兴AXON 9乐视超级电视x55图片来源:视觉中国印度红米note9发布会小米电视儿童锁怎么解三星s6发售价格多少   记...
日期:08-16
阿里不向其出售任何股份 蚂蚁集团向全体股东回购不超7.6%股份
【】7月24日消息,阿里巴巴在港交所发布公告称,阿里巴巴集团收到其持有33%股权的非并表关联方蚂蚁集团的通知,蚂蚁集团于2023年7月23日已召开股东大会,其股东已批准蚂蚁集团向其...
日期:09-20
谁是狼人升级自查自纠系统,有效防范赌博等违规行为
  凭借着互联互通的信息一体化,像谁是狼人这样的热门社交软件,成为人们在了解外部世界、与社会中的其他人产生连接的重要途径。而从相关统计数据来看,交友软件的用户量不断...
日期:06-15
58同城CEO姚劲波提两会建议:促进高质量就业、支持家政服务业数字化等_
2023年全国两会临近,全国人大代表、58同城CEO姚劲波连续六年向全国人大建言献策。今年,姚劲波提出“释放活力、扩大规模、提升服务,进一步促进高质量充分就业”、“畅通大循环,...
日期:03-03
5.5G!华为官宣再获突破!
5.5G呼之欲出之际,近日,华为在5.5G方面再获突破,关键技术测试已全面完成。摩托罗拉发布会发布的新机介绍陌陌ceo唐岩据“华为中国”公众号介绍,近日,华为又全面完成5G-A技术性能...
日期:10-23