您的位置:首页 > 互联网

OpenAI神秘gpt2正在A/B测试,奥特曼抢先剧透,网友已玩嗨_神秘奥特曼是什么奥特曼

发布时间:2024-05-08 22:13:38  来源:互联网     背景:

声明:本文来自微信公众号“量子位”(ID:QbitAI),作者:明敏,授权转载发布

OpenAI正在秘密A/B测试下一代模型,实力超强被怀疑是GPT-4.5或GPT-5。

就在奥特曼当谜语人暗示之后,两款新模型悄悄上线大模型竞技场。

神神秘奥特曼

  • Im-a-good-gpt2-chatbot

  • Im-also-a-good-gpt2-chatbot

和GPT-4-Turbo(左)同场竞技,gpt2-chatbot(右)明显更胜一筹。

提示词:画一个自由女神像。

播放神秘奥特曼照片

此前一款名为gpt2-chatbot的超强模型仅仅上线一天,热情的网友就把服务器挤爆了,不得不下架,大家纷纷表示还没玩过。

这次重新上线后,模型在一次报错中直接给出了跳转OpenAI平台网站的链接

神秘奥特曼是什么奥特曼

这下大家都嗨了,做实了是OpenAI在搞A/B测试?

神秘二奥

还有人表示,这俩模型可能已经在推理和计划方面进行微调。

苹果铃声开头声音大后面变小

播放神秘奥特曼照片

现在在竞技场里随机匹配,就能遇到这俩新模型。

这不,网友们已经纷纷前去测试,一探它们的底细了。

代码能力突出

和第一次露面有所不同,如今想要用上gpt2,只能在Arena(battle)里碰运气,Direct Chat中找不到它们的影子。

有的人运气好,试了5次就成功让这俩模型battle了一局。

神秘奥特曼大全

结合几个示例来看,im-also-a-good-gpt2-chatbot生成的回答似乎总是更简洁一些。

神秘奥特曼是谁?

代码生成方面,它能一次生成一个可执行的游戏代码。

提示词:Code Flappy Bird game in Python

效果如下:

想看神秘奥特曼

如果回答的代码有误,可以进一步追问让它自己改正。

比如让它们写一个康威生命游戏的代码,在未告知使用Colab时,模型写出的代码有问题。

但继续追问并表示自己用的是Colab,im-also-a-good-gpt2-chatbot能够自己修改对代码,im-a-good-gpt2-chatbot不行。

神神秘奥特曼

还有在解决物理题方面,有Reddit用户说im-also-a-good-gpt2-chatbot能解答出其他模型都答不对的物理题。

问题:绿灯侠从一栋高楼楼顶跳下,他从静止状态开始做自由落体运动到地面,在他下落过程的最后1秒时,距离地面的距离是大楼一半的高度,这座楼有多高?

神秘奥特曼是什么

不过我们实测了下,im-a-good-gpt2-chatbot似乎也能做对。

播放神秘奥特曼照片

还有人测试了一道推理题目,im-a-good-gpt2-chatbot可回答正确,im-also-a-good-gpt2-chatbot也能做到但需要两次提示。

问题:现在有两个足球队。球队A赢了8次,球队B赢了5次,已知还剩7次比赛,球队B想要赢得整场比赛,还需要至少赢几次?

神秘之奥特曼

网友:白嫖大家反馈吗?

尽管OpenAI还是没有正式认领gpt2-chatbot,但网友几乎已经默认它们是一家了。

因此有人觉得,gpt2-chatbot在竞技场上搞A/B测试,这不是让大家免费给他当志愿者。

想看神秘奥特曼

OpenAI想要对内部模型进行人工评估,应该付给测试人员报酬,而不是在免费社区做。

播放神秘奥特曼照片

有人觉得他们这么做,就是为了炒热度。

神秘二奥

但现在gpt2-chatbot的底层模型到底是啥还不确定。

有人直接问了gpt2-chatbot,但可能存在幻觉,它表示自己基于GPT-4架构,是GPT-4.5的变体。

但之前奥特曼在公开演讲中已经否定了。测试网友表示自己没有给出过GPT-4.5相关的提示内容。

神秘之奥特曼

也有人怀疑,这两个模型大小不一样,叫这个名字是不是因为采用了GPT-2的架构来训练模型。

这和单纯的MoE不同,它们使用了Q*、合成数据,Sam的推特编辑历史是不是暗示了这一点?

神秘奥特曼是什么奥特曼

值得一提的是,最近有大V爆料称本周OpenAI将公布进军搜索引擎的消息。

想看神秘奥特曼

OpenAI已经更新了网站主页,第一个轮番页是一个搜索框上面写着“向ChatGPT问任何事情”

播放神秘奥特曼照片

爆料说这次发布的时间可能在北京时间周五的凌晨2点。

总之,最近OpenAI的动向,都有点神秘。

参考链接:

[1]https://twitter.com/itsandrewgao/status/1787758687651811705

[2]https://twitter.com/DimitrisPapail/status/1787899811514982887

[3]https://twitter.com/AlphaSignalAI/status/1786025388902097077

[4]https://gizmodo.com/powerful-new-gpt2-chatbot-mysteriously-returns-1851460717


返回网站首页

本文评论
马化腾刚讲完重视 视频号:将收取技术服务费
凤凰网科技讯 12月23日晚间消息,微信发布关于《视频号商家技术服务费管理规则》的公告,称视频号将于2023年1月1日起,面向商家收取技术服务费。凡在视频号签约开店的新商家,可在...
日期:12-23
星链宣布普通用户不再达量降速,但其实网速早就降了
5月4日消息,SpaceX旗下的卫星互联网服务星链(Starlink)宣布,家庭用户将不再在达到流量上限后被降速。成昆铁路扩能改造新闻去年11月份,星链首次宣布设置流量上限,即每月1TB的“优...
日期:05-04
“打假”Sora爆火短片:史上最佳发布,背地里全靠人工驱动
声明:本文来自于微信公众号 头号AI玩家(ID:AIGCplayer),作者:石濑,授权转载发布。Sora,又翻车了。还记得早前OpenAI联动视觉艺术家、电影制作人和设计师等专业创意人士用Sora整活...
日期:05-07
博爵五合一CBCT加持AI后处理软件,操作究竟有多逆天?
去伪存真,五像合一。博爵Bondream 3D-1030Pro,全新上市!作为国产口腔CBCT的明星产品之一,博爵CBCT此次家族焕新,带来更智能、更灵活、更便捷的博爵五合一全功能智能CBCT。博爵口...
日期:06-07
的Mate50开启预售!仅需3999元_mate50预计价格
中关村在线消息:10月8日,据相关爆料,华为官方公布了Mate50E的宣传海报以及售价,新机将于今日上午10:08开启预售,10月14日10:08正式开售,其中128GB版本售价3999元,256GB版本售价4499...
日期:10-13
2600万张矿卡何去何从?矿工玩家和厂商都头疼,没有谁是赢家「买矿卡挖矿」
如果说一张RTX 3080的矿卡卖3000元,那么有没有玩家购买呢?我们估计玩家想必会说疯了吧?按照现在这个行情,我们已经能在4000元的价位上买到全新的RTX 3080,为什么要花3000元去买矿...
日期:09-27
可能不是“Switch 2”!任天堂新硬件或采用全新设计
快科技5月14日,随着近日任天堂现任社长在电话会议中透露新的主机硬件已经进入开发,关于Switch 2”的消息又迎来了一波新的热潮。但近日,gamesindustry发布文章,称任天堂的新硬件...
日期:05-14
“绿色站点,智赢未来”绿色网络峰会成功举办_绿色上网知识竞赛
通信世界网消息(CWW)6月30日,以“绿色站点,智赢未来”为主题的绿色网络峰会在深圳2023国际数字能源展期间圆满举行。全球移动通信系统协会(GSMA)、中国移动设计院、中国电信研究院...
日期:07-01
医生未如实告知患方病情,造成患者损害的,医疗机构应当「医生已经使用未受监管AI工具进行患者诊断,监管机构感到担忧」
**划重点:**美团产品推广华为8月新机- ❌ 医生已经开始使用未受监管和少经测试的AI工具来辅助诊断患者,引起监管机构的担忧。蔚来换电站达300座- ❓ 如何在技术已经应用于医...
日期:02-19
三星嘲讽苹果 iPhone 14 没有创新_三星嘲讽iPhone13111
IT之家 9 月 2 日消息,苹果将于下周正式发布 iPhone 14,但相比 Pro 系列几乎可以说是 iPhone 13 Pro 系列换壳,似乎仅有内存、处理器有些变化,至少目前来看很难出现什么创新或新...
日期:09-05
美国扑了个空!华为“拒绝”公开麒麟芯片数据,令雷蒙多极其不安
在当今数字化时代,信息安全和技术创新成为了全球科技领域中最为炙手可热的话题之一。而华为作为全球领先的通信技术巨头,一直以来都备受瞩目。然而,最近一番动作引发了轩然大波...
日期:10-19
中国移动设计院真实待遇「中国移动设计院与中航光电共建签约仪式成功举办」
通信世界网消息(CWW)2023年12月15日,中国移动通信集团设计院有限公司(以下简称中国移动设计院)与中航光电科技股份有限公司(以下简称中航光电)在京举行“河南省液体冷却技术工程研...
日期:12-16
港科大版图像分割AI“Semantic-SAM”来了 比Meta「分割一切AI」更全能
7月17日 消息:香港科技大学团队开发出一款名为 Semantic-SAM 的图像分割 AI 模型,相比 Meta 的 SAM 模型,Semantic-SAM 具有更强的粒度和语义功能。该模型能够在不同粒度级别...
日期:07-17
联想笔记本电脑价格一览表i5「联想笔记本电脑价格」
联想笔记本电脑,作为全球电脑制造商的一员,在市场上一直保持强劲的竞争力。其品质优良、性能稳定,既适合商务人士,又适合学生和普通用户使用。那么,联想笔记本电脑的价格到底如何...
日期:05-31
科学家最新宇宙发现「中国科学家的新发现,或引爆宇宙学新危机」
原创 | 星空天文微软应用商店下载wps宇宙的真实年龄可能要比理论预测小。计算机模拟的早期宇宙大尺度结构。当前人类对宇宙的主流认识大多建立在所谓的宇宙学标准模型基础上...
日期:01-27
大摩CEO力挺马斯克:他与乔布斯、盖茨齐名 不会输的
凤凰网科技讯 北京时间12月2日消息,埃隆马斯克(Elon Musk)的入主让推特公司经历了一次大动荡,导致大量员工被解雇,名人退出该社交网络,广告商出逃。但是,有一个人没有放弃这位世...
日期:12-03
从RSAC看人是安全的尺度 中美跨洋共话网络安全技术发展
  3月25日,开创全球网络安全行业在线办会先河的“RSAC主题分享万人云峰会”技术峰会如期召开。继全球顶级安全专家围绕网络安全发展战略、安全产业趋势等维度对话碰撞后,来...
日期:05-17
深海捕鱼游戏APP_《捕鱼大明星》益智休闲手游上线!全新玩法带你探秘深海世界
  3月1日,由海南美联互动娱乐文化有限公司开发的益智休闲类手游《捕鱼大明星》已全线完成,目前上架了安卓和iOS双版本,在百度助手等多个应用平台均可下载。据了解,这款游戏设...
日期:07-16
高德地图上线北斗卫星定位查询系统_高德北斗卫星地图导航
11月17日消息,近日,高德地图上线了北斗卫星定位查询系统,用户在定位导航时可查看当前所调用的北斗卫星数量,以及具体编号、方位角、高度角、频点、信号强度相关详细信息。redmi...
日期:11-28
IBM收购系统软件公司 扩展科学计算领域优势(ibm在发展工业软件过程中采用了收购软件企业的模式)
  10月21日消息,IBM(NYST:IBM)近日宣布已经就收购Platform Computing一事签署了最终协议。Platform Computing是一家私人企业,总部位于加拿大安大略省多伦多市,是为分布式计...
日期:07-24