您的位置:首页 > 媒体评论

被OpenAI CEO取关后Yann LeCun再次抨击:ChatGPT对现实的把握非常肤浅

发布时间:2023-02-03 02:04:14  来源:互联网     背景:

机器之心报道

编辑:蛋酱、杜伟

大佬之间的关系,有时真是扑朔迷离。

昨天,有人发现,OpenAI CEO Sam Altman 已经在推特上取关了 Meta 首席人工智能科学家 Yann LeCun。

我们很难确定这次取关发生的具体时间点,但基本能够确定事件原因 —— 几天前,Yann LeCun 在前段时间的一次小型媒体和高管在线聚会上发表了自己对 ChatGPT 的看法:

‘就底层技术而言,ChatGPT 并没有什么特别的创新,也不是什么革命性的东西。许多研究实验室正在使用同样的技术,开展同样的工作。’

在 ZDNet 的‘ChatGPT is ‘not particularly innovative,’ and ‘nothing revolutionary’, says Meta‘s chief AI scientist’报道中,LeCun 演讲的一些细节被披露出来。其中有一些很惊人的评价:

‘与其他实验室相比,OpenAI 并没有什么特别的进步。’

‘ChatGPT 使用的 Transformer 架构是以这种自监督的方式预训练的。自监督学习是我很长一段时间以来一直倡导的,甚至可以追溯到 OpenAI 出现之前。’

‘Transformer 是谷歌的发明,这类语言项目的工作可以追溯到几十年前。’

……

如此,Sam Altman 的取关行动也是情有可原。

在‘取关’被人发现的四个小时后,Yann LeCun 更新了动态,再次转发了一篇‘阴阳’ChatGPT 的文章:

为什么像 ChatGPT 这样的大型语言模型可以滔滔不绝地胡说八道?它们对现实的把握是非常肤浅的

有人就不同意了:‘ChatGPT 是广泛知识和巨大创造力的源泉,已经在大量书籍和其他信息源上接受过训练。’

对此,LeCun 也表明了自己观点:‘没人说 LLM 没用。FAIR 的 Galactica 短暂发布期间,我自己也曾这么说过。人们把它钉在十字架上,因为它会产生胡说八道。ChatGPT 做了同样的事情。但同样,这并不意味着它们没有用。’

实际上,这篇《大西洋报》的文章是对麻省理工学院认知科学小组的一篇论文进行了评论。让我们看一下具体的研究内容。

这篇论文说了啥?

这篇论文的标题为《Dissociating Language and Thought in Large Language Models: a Cognitive Perspective》,作者分别来自得克萨斯大学奥斯汀分校、MIT 和 UCLA。

我们知道,如今的大型语言模型(LLM)通常能够生成连贯、合乎语法且看起来有意义的文本段落。这一成就引发了人们的猜测,即这些网络已经是或者很快将成为‘思维机器’,从而执行需要抽象知识和推理的任务。

在本文中,作者考虑了两个不同方面的语言使用表现来观察 LLM 的能力,分别如下:

形式语言能力,包括给定语言的规则和模式知识;

功能语言能力,现实世界中语言理解和使用所需的一系列感知能力。

借鉴认知神经科学的证据,作者表明人类的形式能力依赖特定的语言处理机制,而功能能力需要语言之外的多种能力,它们构成了形式推理、世界知识、情境建模和社会认知等思维能力。与人类的两种能力区别相似,LLM 在需要形式语言能力的任务上表现出色(尽管还不完美),但在很多需要功能能力的测试中却往往失败。

基于这一证据,作者认为,其一现代 LLM 应该被认真地作为具备形式语言技能的模型,其二玩转现实生活语言使用的模型需要合并或开发核心语言模块以及建模思维所需的多种非特定语言的认知能力。

总之,他们认为,形式语言能力和功能语言能力之间的区别有助于理清围绕 LLM 潜力的讨论,并为构建以类人方式理解和使用语言的模型提供了途径。LLM 在很多非语言任务上的失败并没有削弱它们作为语言处理的良好模型,如果以人类的思维和大脑作为类比,未来 AGI 的进步可能取决于将语言模型以及代表抽象知识和支持复杂推理的模型相结合。

网络靶场建设

ChatGPT 数学水平仍需要提升

LLM 在语言之外的功能能力(如推理等)方面有所欠缺,OpenAI 的 ChatGPT 正是一个例子。虽然此前官宣数学能力再升级,但被网友吐槽只能精通十以内的加减法。

近日在一篇论文《Mathematical Capabilities of ChatGPT》中,牛津大学、剑桥大学等机构的研究者在公开可用和手工制作的数据集上测试 ChatGPT 的数学能力,并衡量了它与在 Minerva 等数学语料库上训练的其他模型的性能。同时通过模拟数学家日常专业活动(问答、定理搜索)中出现的各种用例,来测试 ChatGPT 是否可以称为专业数学家的有用助手。

研究者引入并公开了一个全新数据集 —— GHOSTS,它是首个由数学研究人员制作和管理的自然语言数据集,涵盖了研究生水平的数学,并全面概述语言模型的数学能力。他们在 GHOSTS 上对 ChatGPT 进行了基准测试,并根据细粒度标准评估性能。

测试结果显示,ChatGPT 的数学能力明显低于普通数学研究生,它通常可以理解问题但无法给出正确答案。

每月 20 美元,ChatGPT Plus 大会员上线

不管怎么说,ChatGPT 在商业上的成功是有目共睹的。

刚刚,OpenAI 宣布了‘ChatGPT Plus’,一项每月 20 美元的新付费会员服务。

订阅者将获得一些好处:

马斯克:将于2022年推出特斯拉机器人Tesla Bot原型

可以普遍使用 ChatGPT,即使在高峰期也是如此;

更快的响应时间;

优先获得新功能和改进。

OpenAI 表示,它将在‘未来几周内’向在美国和在其候补名单上的人发出该服务的邀请,并表示会将该服务推广到其他国家和地区。

一个多星期前,有消息称 OpenAI 要以每月 42 美元的价格推出 ChatGPT 服务的 plus 版或 pro 版,但最终定下的每月 20 美元,显然让更广泛的人群有能力使用该服务,包括学生和企业。

某种程度上,这将为市场上任何想要推出的 AI 聊天机器人设定付费标准。鉴于 OpenAI 是该领域的先行者,如果其他公司试图发布每月付费超过 20 美元的机器人,都必须先解释明白一件事 —— 自己的聊天机器人凭什么比 ChatGPT Plus 更值钱?


返回网站首页

本文评论
官翻机是个好生意 但只有苹果做出了知名度_iphone官翻机好吗
前阵子,苹果发布了iPad10。对这样一款非常有争议性的产品,雷科技编辑部的小伙伴们自然毫不客气,纷纷开炮吐槽。在一番讨论后,我们都得出了它不是很值得买的结论。而且,还有人在苹...
日期:11-02
沉迷买椟还珠式消费:钱包空了 心也空了
在消费市场上,年轻人为颜值和联名IP文化而消费的现象越来越常见。从前几年星巴克热卖的猫爪樱花杯,再到今年年初肯德基指定套餐赠送的泡泡玛特盲盒,乃至近期好利来针对中秋节推...
日期:08-31
韩媒渲染中国半导体市场需求乏力,背后有何玄机?_中韩半导体之争
集微网消息,韩国工业经济与贸易研究所(KIET)最新月度调查数据显示,韩半导体产业景气度正持续下滑。matepad10.8鸿蒙正式版该机构基于专家对供需和利润情况看法编制的专业调查指...
日期:08-29
抖音可以社交吗_抖音不搞“盲目”社交
作者 | 鱼三隹微信和Facebook编辑 | 郑玄远离社交战场几年的字节,被传杀了个「回马枪」。近日,抖音在官网低调上线了名为「抖音聊天」的即时通讯软件,提供 Windows 和 Mac 桌面...
日期:01-10
拼多多砍一刀的真相_拼多多砍一刀挥向海外,动了谁的奶酪?
原标题:悄悄试水3年、持续挖阿里墙角,拼多多砍一刀挥向海外,动了谁的奶酪?撰文/石闻天编辑/彭箫恒题图/IC Photo在国内电商市场逐渐接近天花板之后,拼多多尝试在海外复制当年的爆...
日期:09-16
美团优选用的人多么_美团优选,还能再让人省些吗?
现代居民的购物习惯正在悄然发生变化——以往扎堆线下超市、便利店采购的消费者们,从几年前开始多了“美团优选”这个新选项。2020年,董梅在儿子的帮助下学会了网上下单买菜。...
日期:10-13
进门就炒了领导层 收购推特后的马斯克要快乐了「马斯克为什么退出推特」
美国时间 10 月 26 号下午。嬉皮笑脸的马斯克,抱着一个大水槽,摇摇晃晃走进一座大楼。在他的右侧,是一个巨大的推特标志。毫无疑问,这是推特总部。紧接着,推特停盘,进入私有化。看...
日期:11-09
三体b站动画什么时候出_《三体》动画定档12月 B站推出49部国创作品新内容
10月29日,哔哩哔哩(以下简称“B站”)举办了2022-2023国创动画作品发布会,宣布《三体》动画定档12月3日,并将开启《三体》动画全球共创计划。图片来源 B站android强力清理《三体》...
日期:11-06
考拉要消失在“阿里动物园”吗?「考拉能在中国的动物园里看见吗」
文丨HanBT财经原创文章头图来源丨创客贴垂直电商平台们,在2022年迎来了“谢幕之年”。“双十一”电商平台狂欢日来临之前,垂直电商平台却陷入一片萧瑟之中。从母婴电商平台“...
日期:10-19
川普都在用的社交平台 成了Twitter难民避难所_川普的twitter账号
最新一季的《傲骨之战》结尾,再次「恶搞」了一次美国前总统唐纳德·特朗普,称其宣布将参加后年的总统竞选。艺术确实来源生活,还不到一周,媒体消息传来,特朗普在 11 月 16 日宣布...
日期:11-25
一夜之间 AIGC成了所有打工人的“天敌”
来 源:雷科技互联网组编 辑:冬日果酱排 版:KT从去年开始,AIGC 就始终是热议的话题之一,DALL-E 2、Stable Diffusion 还有 ChatGPT 不断刷新大众对 AI 的认知。在刚刚过去的春节假...
日期:02-02
互联网产品神话消失:疯狂下架 再无爆款
Tech星球(微信ID:tech618)文 | 陈桥辉封面来源 | 图虫创意对于各互联网大厂而言,2022年注定是难忘的一年,腾讯CEO马化腾、百度CEO李彦、字节跳动CEO梁汝波、京东集团董事局主席刘...
日期:01-15
你可能觉得赵丽颖唱得假,但至少XR特效很真?
作者 | 李水青编辑 | 心缘今年兔年春晚,大家都看了吗?智东西1月22日报道,大年三十,2023年央视春晚照例引起了全民热议,其中的“元宇宙”元素也亮了。在一开场的《花开种花家》开...
日期:01-23
任正非的寒气吹到了新加坡
作者丨牧歌编辑丨坚果不远万里,拖家带口,以为到了四季如夏的新加坡,就能够告别国内互联网行业的阵阵寒气,开始新的工作和生活。但没想到的是,刚下飞机,最先收到的却是offer毁约的...
日期:09-01
《三体》动画定档12月 B站推出49部国创作品新内容「三体动画版什么时候上映」
10月29日,哔哩哔哩(以下简称“B站”)举办了2022-2023国创动画作品发布会,宣布《三体》动画定档12月3日,并将开启《三体》动画全球共创计划。华为matebookd15锐龙配置图片来源 B站...
日期:11-04
门店数量超过星巴克 瑞幸“翻身”了「星巴克和瑞幸的市场份额」
作者:星影瑞幸咖啡赚钱了,根据瑞幸咖啡公布2022年第二季度财报。二季度总净收入达到32.99亿元,同比增长72.4%,自营门店利润率增长至30.6%。已经实现业务营收连续两个季度 “盈利...
日期:09-15
后摩尔时代,如何保障芯片制造高良率?_后摩尔时代芯片材料技术
近日,世界半导体贸易统计组织(WSTS)发布消息称,继2021年取得26.2%的强劲增长后,预计2022年全球半导体市场增速放缓至4.4%,达到5800亿美元。WSTS预测,随着通胀上升和终端市场需求减...
日期:12-14
标准化凭什么引爆AI新风口?_标准化凭什么引爆ai新风口呢
今年二十大期间,不少媒体在相关报道中增添了一种创新的传播方式——AI数字人报道。如新华社推出了AI主播读新闻系列短视频,在各大短视频平台广为大众所认可;北京广播电视台所打...
日期:11-16
股东大会后,有投资者撰文曝光了迈瑞医疗上述股东大会_在迈瑞医疗身上 投资者不应存在“赌性”
在触及496.15元的历史大顶后,迈瑞医疗(SZ:300760)已经跌了一年时间。这一年时间中,迈瑞医疗的股价下跌近40%,而业绩却仍以超20%的速度持续增长。背离的“剪刀差”让很多投资者...
日期:08-23
记忆是如何欺骗我们的?_人的记忆是有欺骗性的
这两天,“天将降大任于是人还是斯人”引发了全网大讨论,事情是这样的:一个知乎网友发现,中学学过的课文“故天将降大任于斯人也”,课本原文居然是“是人”不是“斯人”。不止是他...
日期:11-01