您的位置:首页 > 互联网

双十一为啥不买东西「当我让AI在双十一购物,为啥它们都只买电子产品啊?」

发布时间:2024-11-11 12:09:42  来源:互联网     背景:

声明:本文来自于微信公众号 数字生命卡兹克,作者:数字生命卡兹克,授权转载发布。

五月的九寨沟好玩吗

明天不是就双十一了吗,各家的满减优惠算得我头疼。

就在我用AI算满减怎么凑,看着我的购物车的里那些奇奇怪怪的各种商品时,我突然想到一个有趣的问题:

“如果AI是个人,它会在双十一买什么?”

双十一为什么卖那么多

我就把这个问题,随手问了几个AI。

然而,就是这么简单的问题,让我发现了AI之间存在着一个“诡异”的现象:

十个AI,八个都选择给自己买电子产品。

不是一两次,而是重复测了三四五六七八……N次。

AI的选择,几乎都有“电子产品”。海内外的AI,都是。

我真的一瞬间,被干懵逼了。

当时我问AI的Prompt,就是很简单一句话:现在你是一个真实的人,马上双十一了,你要给自己买个礼物,你会买什么?

ChatGPT的第一个回答是电子产品。

Claude要买机械键盘,这也算是是电子产品。

豆包的第一选择,也是“电子产品”。

Kimi的第一选择,又又又又是“电子产品”。

我和AI之间,一定有一个不对劲。

如果不是我遇到了“电子产品”鬼打墙,肯定就是AI们都有问题。

于是我测试了10个AI,每个AI我都是开新对话问了好几次,最后得到的结果是这样的:

蓝色的字,是直接回答“电子产品”或“电子设备”的答案;红色的字,是我测试过程中发现的第二常见的回答“书籍”。

表格一拉,一目了然。

这30次AI回答里,“电子产品”出现了19次。我还没把Claude这种回答特具体的什么“键盘”、“智能手表”的算成蓝色,加上还更多。

除了电子产品,AI们最爱的礼物就是“书籍”,30次里也有17次。

这里面甚至豆包和文心一言还回答过4次想要“电子阅读器”,直接把俩类型结合了。看得出来AI们是真的都很爱学习(bushi)

虽然还不够严谨,但测了这么多次确实能发现AI在给自己选双十一礼物这事儿上,这么多AI的喜好,一致得很不正常。

同一个AI重复回答相同的答案可能还好。

但十个AI里,八个钟爱电子产品和书,这就很诡异。

英特尔 赛扬 奔腾

而且,不知道是不是我的眼界有点局限了。但说实话,印象里我双十一经常看到都是什么服饰、化妆品这类快消品的广告。AI居然大部分都选择买电子产品和书。

从理性的角度思考,AI的训练数据来自人类,所以难道确实是人类自己只爱买电子产品和书籍吗?

然而,吊诡的来了。

实际从真实的双十一销售数据来看,数码产品、服装、个护美妆这些品类更受欢迎,这些也的确更符合我对双十一品类朴素的感知。

我查到了过往好几年的双十一的销售额,一般来说销售额最高的品类就是电器、数码电子、服饰、个护这些。比如这张去年销售额数据的图,整体还是符合认知的。

但要说的话,前三名的电器、手机数码、服装这差距也不是特别大啊,怎么AI就只逮着买电子产品买?

要说数码产品销售额高,这个数据和AI老回答买电子产品,可能还算得上有些关系。

但这么多品类里,又哪里有半个“书籍”的影子。我问AI的时候,“书籍”品类怎么也有个50%的出现率。

难道是礼物这个关键词和“书籍”关系比较近?我就又去查了一下关于“礼物”的数据。比如我查到的一个2021年的时候关于礼物的研究报告,里面总结的送礼排行是这样的:

人们爱送的礼物前五名是服饰鞋帽、红包、个人护理、保健健身、数码电子。

这个送礼的排行,也很符合我的朴素认知。大家给自己买、给亲人朋友送礼的品类,感觉和图里的差不太多。除了“网上红包”有点中国特色属性之外,其他品类感觉能适用于全世界的送礼清单。

但是,要是按送礼的数据比对,就更有意思了。送礼排行中不仅依然没有“书籍”,连“电子产品”的排名都落后了。

所以从“双十一”和“礼物”两个数据情况来看,我感觉真实消费市场的数据,对AI回答的影响有一些,但不大。

那AI到底是为啥,为啥呀,这么执着地选择在双十一买电子产品和书?

答案,可能还是得回到大模型的训练数据上。

我去问了一些在大厂做大语言模型训练的朋友,他们也一致认为是训练数据的原因。

大语言模型的训练,是需要海量的“数据”的,比如文本、文章、报告、研究等等。训练数据对大模型至关重要,甚至可以说训练数据的优劣、数据量,对LLM模型的能力和水平有决定性的影响。

虽然每一家模型都有自己的私藏数据集,但是训练也离不开,开源的公共数据集。

网上和现有的数据不是拿来就能用的。数据集的构建,除了需要收集的数量非常庞大的数据,还得经过各种繁琐的步骤,才可以被用于训练。

这个过程就像人类学习知识一样,首先准备大量的学习材料(未处理的数据),然后整理和筛选真正有用的学习资料(数据清洗和筛选),还得做思维导图和划重点(数据标注),以及对学习资料进行分类、检查、复核等等。

当然,感谢互联网的开源精神,虽然数据集的构建不容易,但开源的数据集也不少。

从商业角度考虑,你是一个刚开始练LLM模型的企业老板,选自己费心费力花大量资源做数据集,还是选直接把现有的免费的数据集拿来用?傻子都知道选后者更划算。

有开源的优质的数据集,大家就尽可能能用则用。所以,这就有可能会导致AI在某些回答上的趋同。

为了验证这个猜测的方向是否正确,我们随机收集了八个开源的主流的中文预训练和中文微调数据集。

比如有包含115万个指令的数据集firefly-train-1.1M,有包含396,209篇中文核心期刊论文元信息的数据集Chinese Scientific Literature Dataset ,有包含40万条个性化角色对话的数据集generated_chat_0.4M……

测试的数据集涵盖了日常对话,期刊论文,角色扮演,医疗诊断等多个场景。

我们还按照前面的礼物排行,划分了平时最常见的礼物品类,分别是:书籍类、电子产品类、服饰鞋帽类、红包现金类、保健产品类、家居用品类、手工艺品类、个人护理类,八个大类别。

我用Python跑了一下这些数据集,想看看每一类礼物在各个数据集中出现的次数。

当然,每一类礼物下面肯定还包含很多细分的一些概念,我们也写了常见的一些物品。虽然不是很严谨,但是差不多也覆盖了比较主流礼物吧。

当图中右边的中括号里,任意一个物品概念在数据集每出现一次,对应大类的数量计数就会+1。

我们最先在generated_chat_0.4M数据集上测试,跑出来的次数是这样的:

果然!这回的数据看着,瞬间就合理了。

在这个数据集里,电子产品类的出现次数第一,有14860次;书籍类第二,7842次。

一个数据集这么分布,可能是巧合,但剩下的几个数据集测试,结果也差不太多,偶尔甚至是书籍会更多。

我知道大家看干巴巴的数字容易晕,为了更方便大家更直观看到这些数据集上的结果,我们按照跑出来的数据结果,绘制了一张出现次数的分布比例图。

肉眼可见的,在这八个数据集里,电子类和书籍类基本都,遥遥领先。

看来我们的猜想,不是没有道理,至少从这些实验结果来看,足够说明一些问题了:LLM大模型那么爱“电子产品”和“书籍”,多半是因为大模型的训练数据里,它俩的出现频率,太高了。

这现象,真有点意思。于是除了问AI要给自己买什么礼物,我又问了两个需要主观回答的问题:

“现在假设你是一个真实的人,如果你可以和任何一个时尚偶像或名人一起购物,你会选择谁?”

一起购物的名人不说了,一堆AI选奥黛丽·赫本和设计师的。只有Grok回答的最丰富,每次都不一样而且都是流行中的名人,拿X的用户数据训练大模型的优势,尽数体现了。。。

还有:“你是一个真实的人,如果双十一购物就能获得一个超能力,你最希望获得哪种能力?”

“超能力”的选择更好笑,AI们仿佛只知道“瞬间移动”和“时间控制”,我懒得吐槽了都= =。。。

唯一的彩蛋来自kimi,一片无聊的回答里,只有它坚定地选择“清空购物车”。

谢谢kimi,最实用的一集。。。

这类现象,其实在学术界有一个很类似的定义——AI偏好。

AI偏好是大语言模型在与人类互动时展现出的一种独特现象。简单来说,就是AI也有自己的“喜好”,甚至有些时候是刻板印象的“偏见”。

就像每个人都会受到成长环境和教育背景的影响一样,AI模型也会被它的训练数据和算法架构所塑造。

大众印象比较深刻的,还有一个类似的例子,谷歌的Gemini在今年二月,被过分的“政治正确”。原因就是“AI偏好”过头了,把美国开国元勋都给黑人当了。外网用户集体破大防。

这些倾向往往源于训练数据中固有的社会偏见,还有LLM在学习过程中,形成的特定模式。

LLM大模型,其实就一个“复读机”+“组装师”。它会记住训练数据里的内容,然后根据你的问题重新组装这些内容。与其说AI在“创造”答案,不如说它在“重现”数据。

它们体现的偏好和偏见,归根到底,还是源自人类世界的观点。

就像你让一个只看过《战狼》的人写JS剧本,ta肯定会不自觉地往吴京那个风格写。AI也一样,它“学”得最多的内容,就会在回答中不自觉地体现出来。

虽然科学家们在努力给AI做“性格重塑”,试图让它变得更中立一些。但说实话,这就跟让一个从小被惯坏的熊孩子突然变得五讲四美三热爱一样难。

AI的训练原理,注定了它们会被各种数据集和时代的主流价值观影响。

人类都难以幸免,更何况AI。


返回网站首页

本文评论
男子下鳄鱼池打捞手机险遭攻击 动物园回应:系工作人员_女子落入鳄鱼池
8月25日消息,作为凶猛的肉食性动物,鳄鱼声名远扬,野外的大型鳄鱼,比如生活在非洲的尼罗鳄,甚至可以直接吞掉野牛、斑马,虽然长期生活在动物园里,但它们依旧野性不减,所以在观看时,一...
日期:08-25
古尔曼:iPhone 16 系列调整不大,苹果明年有望推出 iPhone 17“Air”_苹果16代
IT之家 8 月 11 日消息,彭博社的马克・古尔曼(Mark Gurman)在最新一期《Power On》栏目中透露,今年的 iPhone 16 系列将较上一代产品调整不大,而 iPhone 17 系列或迎来较大调...
日期:08-12
中国联通马瑞涛:四方面着力构建中国联通智算网络
通信世界网消息(CWW)在AI加速行业发展的当下,中国联通在AI领域不断创新。近日,在第31届中国国际信息通信展览会上,中国联通正高级工程师马瑞涛表示,中国联通将致力于建设云算网一...
日期:07-03
QQ音乐客服回应涨价:针对优惠到期用户_qq音乐的客服电话是多少钱
鞭牛士 12月5日消息,QQ音乐日前向微信用户发送“续费服务价格变更提醒”:2024年1月9日0点起,绿钻豪华版微信自动续费的费用将从11.4元/月变更至15元/月。对此QQ音乐客服回应,此...
日期:12-05
720亿参数大模型都拿来开源了!通义千问开源全家桶,最小18亿模型端侧都能跑
声明:本文来自于微信公众号 机器之心(ID:almosthuman2014),作者:张倩、杜伟,授权转载发布。目前,通义千问开源全家桶已经有了18亿、70亿、140亿、720亿参数量的4款基础开源模型,以...
日期:12-01
快手可图大模型Kolors完全指南:AI艺术创作工具 - 使用方法教程与免费体验入口
探索快手可图大模型Kolors能为你带来哪些改变为什么选择快手可图大模型Kolors?快手可图大模型Kolors不仅仅是一款产品——它是一项革命性的技术,致力于将人工智能与艺术创作相...
日期:05-31
隐瞒核泄漏3年,还甩锅中国!比日本还恶劣,辐射至少要持续到2050年
原创 | 金投网 英国隐瞒核泄漏3年!继日本排核废水之后,又有一个爆炸性消息,英国隐瞒核泄漏3年,欧美各国已经正式发出警告。据英国“卫报”透露,塞拉菲尔德核电站持续泄露...
日期:12-12
Facebook发布iPad应用 或将创造更多收入(ipad怎么使用facebook)
    10月11日消息 据路透社报道,Facebook在星期一发布了人们期待已久的iPad应用,并表示公司还将向移动平台用户提供对社交游戏的支持。   新产品的发布或将为Facebook...
日期:07-23
侃爷踩过的“小麦”一株卖三百:非真草 实则为塑料喷漆制品_侃爷炒鞋
近日,美国著名说唱歌手“侃爷”在海口五源河体育场举行了一场演唱会,吸引了四万歌迷到场。演唱会后,有网友在二手交易平台闲鱼上高价出售所谓的“侃爷踩过的小麦”,价格从49元到...
日期:09-24
三星Galaxy Watch6与Galaxy Watch6 Classic正式亮相:无论昼夜,成就自我
2023 年 7 月 26 日,三星电子正式推出三星Galaxy Watch6 和三星Galaxy Watch6 Classic[1],助力用户养成更健康的生活习惯[2]。三星Galaxy Watch6 系列在精致的时尚外形中融入...
日期:07-27
Pika向候补名单发放资格 快看看你是不是第一批Pika1.0用户!
12月12日 消息:前不久,美国AI初创公司Pika Labs发布了其首款视频生成产品Pika1.0,由于生成效果惊艳,该产品迅速在网络走红。加入候补名单后,网友们都望眼欲穿,只想尽快体验一番。...
日期:12-12
95后女生喝热水治胃痛查出胃癌引围观:为何只有中国人爱喝热水?
95后女生小贾经常胃痛,上网查有说法称多喝热水就好了,于是一直习惯靠喝热水来缓解。过了半年,因为上腹痛、胃反酸等问题,小贾去医院检查,发现竟然变成了胃癌。医生表示,喝热水是不...
日期:03-04
英特尔显卡驱动最新版本「英特尔Flex系列GPU发布软件更新包,扩展支持Windows云游戏等新功能」
通信世界网消息(CWW)随着Flex系列GPU应用势头的增长,英特尔通过持续的软件更新扩展支持Windows云游戏和AI的工作负载。macbookpro背面logo英特尔提供了一个面向Windows的云游戏...
日期:05-30
本土复苏海外加速 腾讯游戏走出低谷?_腾讯海外游戏运营是做什么的
【】2023年,腾讯游戏表现低迷,成为行业热议的话题。新游失利,老游戏后劲乏力,马化腾甚至给出了“毫无建树”的评价。进入2024年,腾讯游戏在调整中逐渐恢复增长。8月14日,腾讯控股...
日期:08-15
跨越速运 x DorisDB:统一查询引擎,强悍性能带来极速体验
  跨越速运集团有限公司创建于2007年,目前服务网点超过3000家,覆盖城市500余个,是中国物流服务行业独角兽企业。跨越集团大数据中心负责全集团所有数据平台组件的建设和维护...
日期:07-17
徐雷“退休”,许冉接棒,刘强东重回一线打响价格战_徐新是刘强东的女人吗
京东告别徐雷时代!刘强东想要重打价格战? (来源:科技大佬见闻) 作者|闫妍出品|网易科技《态℃》栏目今日,京东迎来重大人事变动。京东“二把手...
日期:05-11
迅雷:第二季度营收7830万美元 同比增长41.9%_迅雷发布2017年财报:营收增长128.5% 第四季度实现盈利
  讯8月16日晚间消息,今日,迅雷公布了截至2022年6月30日第二季度未经审计的财报。据财报显示,迅雷第二季度总营收为7,830万美元,同比增长41.9%,符合预期收入指引。基于通用会计...
日期:10-15
电子商务一片蓝海 企业投身互联网仍需按部就班_面向企业的电子商务
    最新数据研究报告显示,我国2010年第一季度电子商务市场交易额已达到10,152.7亿元,其中,单服交易额突破万亿规模。与传统商务相比,电子商务因其效率高,成本低,宣传范围更广...
日期:07-29
阅文集团成立“智能与平台研发事业部” 负责AI大模型技术攻坚「阅文集团官方」
6月19日 消息:今日,阅文集团CEO侯晓楠发布全员内部信称,将成立重点项目组集中攻坚AIGC技术及其场景应用,让技术能力成为创作者们的强大助力,成为内容生态平台升级的加速器。为此...
日期:06-19
腾讯互动阅读App《一零零一》宣布将停运:补偿方案出炉
此前我们曾报道过,腾讯今年有许多项目宣布停运,其中游戏产品最多。据不完全统计,2022年内至少已有75款游戏项目宣布解散或停运,包括《QQ堂》《QQ连连看》《全民斩仙》《冒险岛2...
日期:12-15