您的位置:首页 > 互联网

开发者火冒三丈炮轰GenAI:垃圾语料太多,模型正在变得越来越笨

发布时间:2024-10-08 22:18:13  来源:互联网     背景:

声明:本文来自于微信公众号新智元,作者:新智元,授权转载发布。

【新智元导读】人工智能是否早已达到顶峰,正在变得越来越愚蠢?

生成式AI(GenAI),尤其是以OpenAI的ChatGPT为代表,人们发现,这些大模型在一年多后的性能表现远不及刚发布时那样令人惊艳了。

AI似乎正在变得越来越笨。

这种声音逐渐出现在各个社交网络的平台上,并有许多拥趸。

在OpenAI开发者论坛上,有用户发帖表示:自从去年最新版本的GPT发布后,模型的准确性就显著下降了。

同样的,一位ChatGPT的用户在今年6月写道,经历了这么多的AI炒作之后,这些模型如今的表现让我非常失望。

Steven Vaughan-Nichols是一位自由撰稿人和技术分析师,在多家科技媒体中担任高级特约编辑。他拥有自己的个人博客,在X上拥有数万名订阅者。

今年8月下旬,史蒂文在《Computerworld》的一篇言辞激烈的评论文章《I’ve got the genAI blues》中表示:

所有主要的公众可访问的AI模型,像ChatGPT和Claude这样的品牌旗舰产品——其性能都不如以前的版本。

文章地址:https://www.computerworld.com/article/3488589/ive-got-the-genai-blues.html

他在文章中写道,这些由AI生成的结果常常令人恼火。它们有许多荒谬的错误,更糟糕的是,这些错误的出现总是反反复复,没完没了。

如果只是答案平庸但相对准确,我还可以想办法应对。但它生成的内容让我无能为力。

以下是这篇评论文章的内容。

I’ve got the genAI blues

ChatGPT之类的工具远没有你想象的那么好,而且随着时间的推移,它们的表现越来越糟。

我也希望生成式AI真的有用,但事实并非如此。我一直在不断尝试使用各种AI——如ChatGPT、Meta AI以及Gemini等。

这些模型在你不太了解相关领域的情况时,看起来似乎是有用的,它们生成的回答也很合理。

但只要你仔细考察一番,就会发现这些答案是错误的。

如果你对内容的需求仅在高中水平,模型生成的答案还算过得去。但当你需要深入挖掘或研究某个主题时,那就另当别论了。

以我日常的工作内容为例,在Linux和开源软件等主题上,我比一般的大语言模型(LLM)了解得更深入。

在我使用生成式AI对这些主题进行研究时,AI能给出的回答乍一眼看上去可能不错,但你越深入的去讨论一些细节时,它能给出的信息就越贫乏。

这些由AI生成的结果常常令人恼火。它们有许多荒谬的错误,更糟糕的是,这些错误的出现总是反反复复,没完没了。

如果只是答案平庸但相对准确,我还可以想办法应对。但它生成的内容让我无能为力。

这并非仅是我一个人的看法。

《商业周刊》报道,许多GPT-4的用户发现它变得越来越懒和愚蠢。

其他人也对此表示认同。

正如最近在Reddit上的用户所说的那样,现在ChatGPT3和4的效果远不如我一年前订阅专业版时那么有效和有帮助。

奥马冰箱546价格

在我看来,即使是最好的生成式AI聊天机器人Perplexity也在走下坡路。

以前我喜欢Perplexity的一个原因是它会为其观点提供来源。在我把它看作是一个超级增强的搜索引擎时,这个功能很有用。

然而,最近它的表现也越来越不稳定,我再也无法指望它能够准确地给出它是在哪里找到、并重新整合出的这些信息。

为什么会这样?

虽然我并不是AI开发者,但我密切关注这个领域很久了。

以下是我看到的导致模型开始失效至少两个主要原因:

首先是用于创建主要大语言模型的内容质量问题。

许多模型的训练集中包含了来自诸如Twitter、Reddit以及4Chan等优质网站的数据。

正如谷歌在今年早些时候发布的AI概述所显示的那样,采用这些数据集对AI进行训练的结果可能会非常糟糕。

《麻省理工科技评论》同样指出,现在的AI会生成一些质量极差的答案。

如建议用户往披萨上加胶水或每天至少吃一块小石头,以及前美国总统安德鲁·约翰逊在1947年至2012年间获得了大学学位,尽管他于1875年去世。

这类回答都是些无伤大雅的蠢例子,但如果你需要一个正确答案,那就完全是另一回事了。

以一位律师为例,他的法律文件中包含了由AI虚构的案例信息,法官们发现这一事实后并不会被逗笑。

如果你只是想用生成式AI闲聊(这似乎是ChatGPT最流行的用途之一),那么准确性可能对你并不重要。

但对于我,以及所有希望将AI用于商业的人来说,正确答案才是最重要的。

随着生成式AI巨头继续寻找更多数据,这个问题只会变得更糟。

来自Epoch AI的一项研究发现,我们最早将在2026年耗尽高质量数据。

这就引出了第二个问题。

如今,生成式AI生成的内容正在取代专家级人类内容。

结果不仅仅是劣质数据排挤了优质数据,情况还要更为糟糕:

《自然(Nature)》的最近的一篇论文发现,不加区分地从其他模型生成的数据中学习会导致‘模型崩溃’。这是一种退化过程,随着时间的推移,即使分布没有随时间变化,模型也会忘记真正的底层数据分布。

我愿将其称为垃圾进,垃圾出(Garbage In, Garbage Out)。

但由于我看不到公司会停止使用生成式AI以更低的成本来生成文档,因此未来充斥在互联网中的内容质量只会继续下降。

不管你信不信,就质量而言,我们可能已经处于人工智能的顶峰。

这难道不是一个可怕的想法吗?

当然,我不是一个极端的AI反对者。

基于专用大语言模型的特定用途的生成式AI聊天机器人,在作为排查程序故障或发现潜在癌症的工具时,已经非常有用。

其他的一些用途中,如在线游戏中由AI驱动的非玩家角色,将提高游戏体验,而像ElliQ这样的AI朋友可以帮助很多孤独的人。

但作为大多数公司热衷的替代知识型员工的方式,还是算了吧。

除了CEO——他们倒是可以被AI聊天机器人取代。

我怀疑很多人不会注意到AI CEO与人类CEO的区别——除了它会为公司节省一大笔钱。

生成式AI的未来

这不应该是事情发展的方向。

通常来说,新的版本软件应该比它们所取代的版本更好。

但由于生成式AI需要通过大量数据进行训练,而随着人类世界的高质量内容日益枯竭、互联网越来越多地充斥着AI生成的劣质内容,模型未来的性能表现将会成为一个越来越严重的问题。

当然,我们也有可能会重新发现由人类完成的那些极其珍贵且不可替代的工作的价值。

但最好也别对此抱有太大的希望。

参考资料:

https://futurism.com/the-byte/ai-dumber


返回网站首页

本文评论
WPS被指套娃式收费 负责人回应: AI功能福利期已到_wps套件
5月10日 消息:近日,针对消费者普遍关注的WPS套娃式收费问题,WPS官方负责人做出了积极回应。据了解,WPS的AI功能此前作为会员用户的福利之一,随着其商业化的推进,福利期已告一段落...
日期:05-10
荣耀升级系统好吗「为了更好迎合用户,荣耀这波操作真香,老手机升级新系统?」
众所周知,在2023年华为开发者大会之上,有一个系统版本横空出世,它就是HarmonyOS 4,同时讲实话HarmonyOS 4也顺势成为了当下业内关注的焦点,不仅仅该系统版本功能强大,同时在综合体...
日期:08-08
荣耀20前置像素「曝荣耀80下周发布:2000价位段 2亿像素」
今晚有消息称,荣耀的新机荣耀80系列将在下周发布,虽然目前官方还没有官宣,但外观、芯片等已经曝光的差不多,并且已经完成了入网,荣耀80系列手机共有三个版本,分别是荣耀80SE、荣耀...
日期:11-12
微软2020研发投入「大举投资满足AI服务需求-微软发布激进支出计划」
北京时间7月26日早间消息,微软在第四财季收入和利润超出华尔街预期后,发布了一项激进的开支计划,希望借此满足市场对其新型人工智能服务的旺盛需求。根据这项计划,微软将大幅增...
日期:09-19
ChatGPT被起诉索赔30亿!「未经允许收集并泄露个人信息」,16人匿名状告OpenAI
声明:本文来自于微信公众号 量子位(ID:QbitAI),作者:明敏,授权转载发布。一天吃两起官司,ChatGPT现在有大麻烦了。原因都和数据有关。先是16人匿名起诉OpenAI及微软,认为他们在未...
日期:07-08
Avanci布局中国车企“好友圈”_aval车
通信世界网消息(CWW)随着信息通信技术的快速发展,智能网联汽车已成为行业趋势,正迎来前所未有的发展机遇。随之车联网知识产权纠纷也逐渐增多,如诺基亚诉戴姆勒侵犯通信专利许可...
日期:06-06
2024款理想L9有什么:理想发布购买新车6个理由_理想2021年出哪些款
快科技3月25日消息,理想汽车官方今日发文,公布了选择2024款理想L9的6个理由。官方针对动力、续航、舒适、智能化进行了讲解。详细来看,续航方面,理想L9全系标配52.3千瓦时大电池...
日期:03-25
今日头条旗下悟空问答App将再上线「悟空问答 今日头条」
2 月 2 日讯:据Tech星球报道,今日头条旗下两年前关停运营的“悟空问答”APP,将择机再次上线。玻璃后盖的旗舰手机乐视盒子C1谷歌手机pixel 6更新系统...
日期:02-02
大势已定!华为向世界宣布,逆境翻盘!华为又传来两个重磅好消息
华为之路:逆境中的坚韧与创新谈及芯片,很多人会想到尖端制造和封测技术,但华为却并不从事这些。它的光芒主要来自于设计领域——特指华为海思,这是华为的“智慧之源”。海思不仅...
日期:09-15
福特工资「时薪最低120元还想加薪40% 福特解雇600名没有罢工的汽车工人」
快科技9月17日消息,据报道,美国汽车工人联合会(UAW)表示,在工会同时对通用汽车、福特汽车和克莱斯勒母公司Stellantis旗下的三家工厂发起罢工后,工会计划于周六恢复谈判。苹果应用...
日期:09-17
小米2s报价「小米2s价格」
近年来,小米公司一直推出各种高性价比手机,其中小米2s也是备受瞩目的一款。小米2s于2013年4月发布上市,备受好评。现在,小米2s依然备受消费者青睐,下面我们一起来看看小米2s的报...
日期:05-29
马斯克身价损失152亿美元「今年马斯克个人财富损失近2000亿美元 打破吉尼斯世界纪录」
1月9日消息,据国外媒体报道,特斯拉首席执行官马斯克自2021年11月以来净资产损失近2000亿美元(约合人民币1.37万亿元),一举打破了历史上个人财富损失最大的吉尼斯世界纪录。据福布...
日期:01-09
verizon iphone可以在国内用吗_Verizon版iPhone让人失望的十个理由
  1月13日消息,据国外媒体报道,本周一,Verizon宣布将于2月10日开始发售CDMA版iPhone,售价介于199美元到299美元之间。Verizon在发布会上并没有透露过多iPhone的信息,看起来Ver...
日期:07-25
汽车之家「直播无线(4G)背包」获七牛云「2019年度创意硬件产品奖」
  近日,七牛云「 2019 年度创意硬件产品奖」在上海揭晓,来自汽车之家的「直播无线(4G)背包」项目,凭借其出色的创意和优秀的设计实践,荣膺此项大奖。   项目背景:   直播...
日期:07-12
中国移动在2020年推进全社会数字化转型「中国移动助力打造数字政府“甘肃模式”」
通信世界网消息(CWW)深入推进数字政府建设,是适应信息化时代趋势,加快建设数字中国的必然要求。作为全国首个在省级进行数字政府建设统筹和系统集成的省份,甘肃数字政府项目在建...
日期:07-18
清华、北邮等联合发布首个大模型时代下的文本水印综述
1月26日 消息:在大模型时代,清华、港中文、港科广、UIC、北邮联合发布了一篇文本水印综述,全面探讨了大模型与文本水印技术的交融。该综述首先回顾了文本水印的起源,随后聚焦于...
日期:01-26
OPPO Find X7系列曝光:Ultra版独享卫星通讯_find7 coloros2.0
快科技12月14日消息,博主数码闲聊站”今日曝光了OPPO新机OPPO Find X7系列,预计将会在明年1月推出。5g手机优惠购博主表示,搭载天玑9300处理器的中杯将采用3x单潜望镜,而搭载第...
日期:12-15
基于LLaMA!开源模型Giraffe将LLaMA上下文窗口扩大10倍 达3万个token
文章概要:1. 研究人员扩展了开源 LLaMA 模型的上下文窗口,创建了 Giraffe,上下文窗口扩大10倍,达到约32,000个标记。2. Giraffe适合需要处理数十页文本的商业应用,为大上下文语言...
日期:08-25
红杉中国宣布成立创业加速器YUÈ
界面新闻获悉,8月15日,红杉中国宣布成立创业加速器YUÈ,为处于天使轮到A轮的中国创业者提供红杉独家研发的体系化创业课程和资源服务。   创业加速器YUÈ由红杉全球执行合伙...
日期:08-17
马斯克分享猎鹰9号火箭“死亡俯冲”的视频「猎鹰9号火箭起飞重量」
据CNET报道,SpaceX正在发射如此多的猎鹰9号火箭任务,它们几乎是例行公事。但是,有时人们可能对一项任务产生新的看法。周四,SpaceX 创始人埃隆·马斯克 (Elon Musk)在Twitter上...
日期:10-10