您的位置:首页 > 互联网

疯狂污染互联网,人类比 ai 擅长多了什么「疯狂污染互联网,人类比 AI 擅长多了」

发布时间:2023-06-24 13:18:38  来源:互联网     背景:


人们最担心的事情还是发生了。

一位网友在提问 New Bing 时,答案出现了事实性错误,他点开参考链接时发现,作为引用源的知乎回答,居然也是 AI 生成的。

回看这个知乎账号,遣词造句尽显 AI 风味,答题速度迅雷不及掩耳,目前已经被禁言了。


被看到的冰山一角,指向了一个恶性循环:AI 生成错误信息,这些信息又被喂给更多的 AI,导致互联网的信息质量越来越差。

但硬要较真,AI 污染互联网,不全是 AI 的锅。

AI 造假,神乎其技

生成式 AI 有概率输出错误信息,这是刻进 DNA 的顽疾,联网能够缓解部分症状,因为可以参考多个信息源,但没想到这么快,我们因此陷入了新的混沌,正如古早的计算机格言:

疯狂污染互联网,人类比 ai 擅长多了什么

garbage in, garbage out(垃圾进,垃圾出)。

AI 正在悄悄创作越来越多的「假冒伪劣」,说不定你在冲浪的时候就遇到过。

国内外已经发生了好几起 AI 假新闻事件。


今年 4 月,多达 21 个账号同时发布了一条骇人听闻的消息:甘肃一火车撞上修路工人,致 9 人死亡。

网警初步判断信息不实,锁定了深圳某自媒体公司,经过取证后发现,犯罪嫌疑人在全网搜索近几年社会热点新闻,并通过 ChatGPT 修改编辑,再将内容多次上传。

国外知名科技媒体 CNET,也在年初被曝光用 AI 偷偷生成文章,其中 77 篇存在不少错误。


新闻可信度评级机构 NewsGuard 甚至发现,涉及 7 种语言的 49 个新闻网站,内容大部分或完全由 AI 生成。

它们「师出同门」但各有千秋,有的杜撰虚假信息,有的重写其他媒体报道,其中产量高的每天发出数百篇文章。


最有趣的来了,NewsGuard 是通过搜索「As an AI language model」等 AI 常用短语发现这些网站的。连 AI 的口头禅都不删去,脏活也做得太过粗糙。

若在社交媒体和点评网站查找类似内容,你也会发现无脑复制 AI 的账号已经大行其道。

亚马逊一款吸尘器的虚假评价不遮不掩:「作为一个 AI 语言模型,我没有亲自使用过这个产品,但根据它的功能和用户评论,我可以自信地给它打 5 星。」AI 骗人这么诚实,背后原因令人暖心。


不只文本,图片和视频的深度造假也越发炉火纯青。

穿着羽绒服的教皇,被视作第一个真正大规模的 AI 虚假信息案例,当时在Twitter的浏览量达到 2600 多万次。「AI 生成图片」的说明,后来才补充在图片下方。


疯狂污染互联网,人类比 ai 擅长多了什么

更多的模仿随之而来。特朗普下乡再就业,在街头拉黄包车;异形体验生活,上了一天的班然后深夜买醉……更有甚者,用 AI 生成「新闻图片」,对不存在的历史言之凿凿。

TikTok 上的「汤姆·克鲁斯」,以假乱真的程度,本人看了也得犯迷糊。


风险与你不一定隔着屏幕,也可能已经蛰伏身边。

今年 4 月,技术专栏作家 Joanna Stern 做了一项实验,录制 30 分钟的视频和 2 个小时的音频,然后用 AI 克隆了自己,它甚至骗过了银行和她的家人。


AI 让我们对那些曾经不容置疑的事物,也抱有基本的警惕心。

当你连接到互联网,你和 AI 都会消费 AI 生成的内容,这个时刻已经到来。

AI 污染不仅影响现在,也可能带偏未来

以上这些是 AI 污染互联网的现状,往后的发展可能更让人不安。

让人类中招的同时,回旋镖也将打在 AI 身上。

一项英国和加拿大的研究发现,当人类越来越多地通过 AI 生成内容,它们会大量进入在线数据库,被用来训练未来的 AI,如果一代又一代地延续下去,最终将导致「模型崩溃」。

rtx3060支持pcie4.0吗


具体来说,随着时间的推移,AI 生成的错误会复合,造成从中学习的下一代 AI 更加错误地感知现实,并迅速忘记大部分原始数据,无法区分事实和虚构。研究人员打了一个生动的比喻:

就像用塑料垃圾散布海洋、用二氧化碳攻占大气,我们即将用废话填满互联网。

作为结果,通过抓取互联网数据训练新模型,将变得更加困难。

雪上加霜的是,内容平台们打算筑起城墙,让免费的、高质量的公开数据有了门槛。


前段时间,「美国贴吧」Reddit 计划对 API 进行收费,原因是他们的内容正在被白嫖给 AI 训练,ChatGPT 和 Google Bard 之前都爬过 Reddit 的数据。

Reddit CEO 表示,Reddit 的语料库非常有价值,他们不想把这些内容免费提供给巨头。

Reddit 的 API 收费,对 OpenAI、Google 等家底深厚的玩家影响不大,但 AI 初创公司获取数据更难了。那些长期依附 Reddit 的第三方应用,更是在这次变革中被牵连,带头宣布倒下。


在商言商, Reddit 可能是在自救,之前盈利主要靠广告投放,AI 反而挖掘了 Reddit 数据的商业价值,其他 UGC 内容平台说不定也在打算盘,这对很多 AI 初创公司来说不是好事。

公开数据还不是唯一的挑战,不少 AI 初创公司想在金融、医疗等领域构建垂直的 AI 模型,然而获取专有的训练数据集并不容易。


拥有这些数据的企业们,更愿意和大型科技公司建立合作关系,因为巨头的可信度更高,处理数据的方式更好,更能保障数据安全。

高质量数据是 AI 模型的护城河,获取数据却或多或少地成了一场利益的博弈,将互联网划分为孤岛,或者干脆排资论辈上演军备竞赛。

一方面,互联网的内容本就参差不齐,另一方面,互联网又趋向封闭。未来各家的 AI 要如何接收优质内容训练和微调,成了一个悬而不决的问题。


至少在互联网数据这块,AI 还真可能「自给自足」。剑桥大学教授 Ross Anderson 指出,目前,大多数在线文本都由人类编写,但它们已经被用来训练 GPT-3.5 和 GPT-4,未来,越来越多的文本将由大语言模型编写。

那么,如何避免 AI 生成内容质量下降,一代不如一代?英国和加拿大团队提出了两种方法。


一是保留原始数据集的副本,并避免它被 AI 生成的数据污染,然后可以基于这些数据,定期重新训练或者从头刷新模型。

二是将新的、干净的、人类生成的数据集,重新引入到模型训练中。然而,前提是存在某种可行的方式,区分 AI 和人类生成的内容。

ChatGPT 的数据源截至 2021 年 9 月,在那之前的互联网可能是最后一片净土。

从此以后我们踏进了暗流涌动的世界,困境摆在眼前,应对措施悬在空中。

被用来制造垃圾的 AI,本该提高互联网的下限

不过,互联网被污染的锅,不该全由 AI 来担。

事实上,AI 本该用来提高互联网内容的下限,在 ChatGPT 前身 GPT-3 的时代,已经有人将它作为写作工具了。

AI 从新鲜的玩具变成提升生产力的工具是必然的趋势,因为它学习了海量知识,擅长写出有板有眼的文章和代码,如果再由人力审核和编辑,其实已经比不少「内容农场」的质量要高。


「内容农场」指的是那些快速生产内容、从而赚取流量和广告费的网站。

这类网站通常找不到作者,掺杂大量广告,抢占搜索页面的前排,内容多半缺乏原创且无法保证真实性,很可能是盗取或拼凑他人文章,有来源不明、质量低劣、翻译不准等问题。

现在,AI 却被拿来制造新的内容农场,这是人类出于利益的选择。除了各种假新闻和假图片,电子书网站、科幻杂志投稿等,也被 AI 批量生产的垃圾充斥。


软件工程师 Chris Cowell 花了一年多的时间,编写了一本技术指南。结果在这本书发行前,亚马逊已经出现了相同主题的、由 AI 生成的电子书。

他担心的不是销量,而是这种低质量、低价格、省时省力的 AI 写作,会让同样打算编写小众书籍的人类产生「寒蝉效应」,降低写作热情,不愿意再发出声音。

AI 初创公司 Hugging Face 的首席伦理科学家 Margaret Mitchell 警告,随着 AI 生成的内容越来越多,我们可能读到大量不符事实的内容,但又无法追溯真相。


这就像是一个 AI 主导的「后真相世界」。

「后真相」指的是,客观事实在塑造公众舆论方面的影响力,反而低于诉诸情感和个人信仰的内容。它被《牛津词典》评为 2016 年年度词汇,至今依然适用。

前段时间,路透社一项针对 9.3 万多名成年人的调查发现,用 TikTok 看新闻的年轻人越来越多了。至于内容有多可信,那就得打个问号。


最近,TikTok 流传着泰坦尼克号从未沉没的说法,有理有据也就罢了,却只见张口就来的阴谋论。有人用魔法打败魔法,制作辟谣视频,关注度并不低,但没有谣言出圈。

一位研究泰坦尼克号 60 年的专家感叹:「看到这么多垃圾出现,让人有点泄气。」

更让他担心的是,这类内容的受众里有很多青少年,他们使用 TikTok 的时间越长,就越相信自己所看到的,然后算法推荐更多相关内容,应接不暇地激发快感,将他们彻底包围。

更多类似的趋势在上演。

断章取义、支离破碎的片段式消息流转于社交媒体,但严肃内容又可能被评论「太长不看」。


制作粗糙的短视频,促使新的「黄色新闻」兴起。或是家长里短的摆拍,或是没有营养的奇闻逸事,让人想骂一句「没有新闻可以不发」。

5 分钟的小帅小美式电影解说,则是适合下饭的「电子榨菜」,空镜和转场什么的不重要,将人物标签化,选取最猎奇或悬疑的情节讲解就好。


所以,在 ChatGPT 之前,互联网已经内容降级,它不止关乎具体内容,更关乎用户的媒介使用习惯,如果 AI 被用来加速这个过程,然后再被这些数据训练,那么人类将更加无法抵挡污染。

严肃和通俗内容都有受众,也都值得生产,问题的核心并不在这里。尼尔·波兹曼在电视时代就提出警告,媒介社会面临的最大问题,不是电视为人们提供娱乐性的内容,而是所有的内容都以娱乐的形式表现出来。


相比印刷媒介的严肃与有序,电视等大众媒介瞬间传递信息,如果沉溺于技术营造的视觉快感,受众可能会渐渐失去独立思考的能力。

互联网时代不外如是。

疯狂污染互联网,人类比 ai 擅长多了什么技术

对视觉化、简短化、情绪化内容的生产和消费倾向,为 AI 污染互联网塑造了肥沃土壤,甚至让人们对虚假信息的抵抗能力降低。

所以,AI 污染互联网不全是 AI 的锅,它可以用来完成更好的事,也可以让现状持续。先是人类选择想要怎样的世界,然后 AI 负责放大它。


返回网站首页

本文评论
疯狂小杨哥遭打假后晒质检报告 专家:仅能证明送检样品合格
11月18日消息,近日知名职业打假人王海打假知名网红疯狂小杨哥”,称小杨哥售卖的破壁机与绞肉机存在质量问题,随后疯狂小杨哥”公布破壁机检验合格的质量检验报告。有谷歌的华为...
日期:11-19
海底捞要求必须点锅底 为节省成本不再主动送小零食「海底捞必须点小料吗」
最近有网友爆料称,海底捞不再允许单点4个清水锅,必须至少点一个锅底才能下单,此事在微博上引起广泛关注。对此,海底捞客服回应称,必须点一个锅底才能下单,不能自带锅底。印度发射...
日期:03-14
如何在抖音做一档音乐旅行节目「如何在抖音做一档音乐旅行节目赚钱」
声明:本文来自于微信公众号 新声Pro(ID:xinsheng-pro),作者:王诗怡,授权转载发布。尽管已经去过好几次丽江古城,但「跟着」张信哲逛那个叫忠义市场的菜场,看唐汉霄拿着柿子、茄子...
日期:02-08
华为阅读月活跃用户突破1亿_华为阅读有用吗?
华为阅读近日宣布,其月活跃用户已突破1亿,覆盖全球170多个国家和地区,平台提供超过100万本优质图书和180万本有声读物,以及精选的具有独家设计和特色的“精品图书”。华为阅读CE...
日期:04-21
百度地图定位自己车辆停车位置「百度地图车位级导航功能场景已落地全国20余座城市」
9月29日消息,百度地图官微披露数据显示,截至目前,百度地图车位级导航已在全国20余座城市实现落地,覆盖大型商业中心、交通枢纽、城市路侧、医院园区等超多场景,成为全球最大的车...
日期:10-03
后疫情时代,初创企业生存之策_后疫情时代企业生存与发展
  作者: Nutanix亚太及日本地区高级副总裁兼销售负责人 Matt Young   初创企业总是面临着救火、融资等“生存”挑战,尤其在当下的特殊环境中,效率、产能和增长的压力急剧...
日期:07-14
AI,在网上给自己建了一座「鬼城」
上帝或许也是这样,愉悦地观察着人类的生活。作者 | Founder Park新一轮 AI 革命的浪潮正在席卷全球,人们看到了 AGI 的曙光和智能的涌现。你可以在 Glow 或者 Character.AI 上...
日期:04-26
淘宝的垄断_质疑淘宝行霸王权 分拆大淘宝破除网购垄断
  10月11日,众多小卖家聚集在YY语音聊天34158频道,甚至拉来不甚相关的人士一起疯狂在淘宝商场大卖家网页“购物”。攻击,像铺天盖地的蝗虫,拍商品、给差评、拒付款,一个个大商...
日期:07-24
REDMI K50_Redmi K50 Pro + 细节曝光
  半年前,小米发布了 Redmi K40 系列机型,包含 K40、K40 Pro 和 K40 Pro+ 三个版本,凭借着极高的性价比,该系列机型自上市之后便饱受好评,是截至目前 K 系列最受欢迎的产品。...
日期:07-10
华为本月底将召开发布会:折叠屏手机、手表将发布「华为官网折叠手机最新消息」
上个月华为Mate 50系列正式发布,燃起了不少用户的热情,而有消息称华为将在本月底继续召开新品发布会,其中将会上市华为P50 Pocket new手机,新机将以6000元左右的价格发布,再一次...
日期:10-15
女子存5万被要求提供收入证明上热搜 抽出100元秒解决
2月7日消息,话题#女子存5万被要求提供收入证明#登上热搜榜第一。据报道,浙江湖州一位女士发视频称,自己去银行存5万元,被要求提供收入证明等材料。三星的5g支持国内?女子觉得很...
日期:02-07
三星官方网_三星官方网上商城
是三星公司为宣传和销售自己的产品而建立的网站,其主要面向的用户是普通消费者和企业客户。通过,用户可以了解三星产品的最新资讯、技术特点、应用场景等信息,也可以轻松选择和...
日期:05-29
独家对话华创资本熊伟铭,还有什么AI项目值得关注和投资?「熊伟持股」
声明:本文来自于微信公众号 凤凰网科技(ID:ifeng_tech),作者:刘毓坤,授权转载发布。第三届BEYOND国际科技创新博览会在澳门威尼斯人金光会展中心正式开幕,在此期间,凤凰网科技《AI前...
日期:05-17
小红书健康等级异常了咋办?「小红书出现异常」
声明:本文来自于微信公众号 麋鹿先生Sky(ID:milusir94),作者:麋鹿先生Sky,授权转载发布。每个月的25号,对于小红书的博主们来说,都是一次特别的日期,有些人开心,有些人难过,无他,正是...
日期:03-29
三星i8550「三星i8552怎么样」
三星i8552是一款2013年推出的中端机型,搭载了Android 4.1操作系统,配备有4.0英寸TFT触摸屏,分辨率为480 x 800像素,其屏幕显示效果较为出色,画质比较清晰。该手机搭载了1.2GHz双...
日期:05-31
三星3050「三星3050显卡和蓝天3050哪个好」
是一款智能手机,由全球知名品牌三星电子研制并推出。该款手机的主要特点是外观美观、性能强劲,同时还拥有较好的价格性价比。外观方面,采用了5.0英寸高清IPS触控屏幕,支持1280*7...
日期:05-31
ibm生产的超级计算机_从制表机到超级计算机:百年IBM的24个瞬间
  导语:国外科技网站Informationweek今天发表评论文章,回顾了IBM百年历史中具备里程碑意义的24个瞬间。   以下为文章主要内容:   IBM今天迎来百年华诞。从打孔卡到S/36...
日期:07-30
AI赋能费用管控,如何做到精准、高效和智能化?(人工智能赋能)
  作为快速消费品行业的企业,市场费用管理(促销费用和日常费用)是企业资金最难控制的流出口,如何将费用的支出控制在合理范围内,降低内部成本,提高资金的效率,提高投资回报率,...
日期:10-03
联通在线5G创新大会在南京召开  全面赋能5G数字内容应用创新(中国联通5g创新中心)
  12月10日,联通在线信息科技有限公司(以下简称“联通在线”)“5G创新大会”在南京召开。会上,联通在线宣布携手华为成立“5G数字内容应用联合创新实验室“,共同推动5G内容...
日期:04-19
发黑床单、盗版影片、摄像头偷窥无遮拦:这样的私人影院难持久
只需一套投影设备、一组氛围灯、一张床,消费者就能享受自在的观影乐趣。如今,凭借可提供更为私密、更多选择的观影体验的优势,私人影院在各地蓬勃发展。然而,记者调查发现,生机盎...
日期:08-16