您的位置:首页 > 互联网

吴恩达ChatGPT课爆火:AI放弃了倒写单词,但理解了整个世界

发布时间:2023-06-04 14:13:08  来源:互联网     背景:

明敏 杨净 发自 凹非寺
量子位 | 公众号 QbitAI

没想到时至今日,ChatGPT竟还会犯低级错误?

amoled芯片市场有多大

吴恩达大神最新开课就指出来了:

ChatGPT不会反转单词!

比如让它反转下lollipop这个词,输出是pilollol,完全混乱。



哦豁,这确实有点大跌眼镜啊。

以至于听课网友在Reddit上发帖后,立马引来大量围观,帖子热度火速冲到6k。



而且这不是偶然bug,网友们发现ChatGPT确实无法完成这个任务,我们亲测结果也同样如此。





△实测ChatGPT(GPT-3.5)

甚至包括Bard、Bing、文心一言在内等一众产品都不行。



△实测Bard



△实测文心一言

还有人紧跟着吐槽, ChatGPT在处理这些简单的单词任务就是很糟糕。

比如玩此前曾爆火的文字游戏Wordle简直就是一场灾难,从来没有做对过。



诶?这到底是为啥?

关键在于token

之所以有这样的现象,关键在于token。token是文本中最常见的字符序列,而大模型都是用token来处理文本。

它可以是整个单词,也可以是单词一个片段。大模型了解这些token之间的统计关系,并且擅长生成下一个token。

因此在处理单词反转这个小任务时,它可能只是将每个token翻转过来,而不是字母。



这点放在中文语境下体现就更为明显:一个词是一个token,也可能是一个字是一个token。



针对开头的例子,有人尝试理解了下ChatGPT的推理过程。



为了更直观的了解,OpenAI甚至还出了个GPT-3的Tokenizer。

r7000p之后有加摄像头吗



比如像lollipop这个词,GPT-3会将其理解成I、oll、ipop这三个部分。

根据经验总结,也就诞生出这样一些不成文法则。

  • 1个token≈4个英文字符≈四分之三个词;
  • 100个token≈75个单词;
  • 1-2句话≈30个token;
  • 一段话≈100个token,1500个单词≈2048个token;

单词如何划分还取决于语言。此前有人统计过,中文要用的token数是英文数量的1.2到2.7倍。



token-to-char(token单词)比例越高,处理成本也就越高。因此处理中文tokenize要比英文更贵。

可以这样理解,token是大模型认识理解人类现实世界的方式。它非常简单,还能大大降低内存和时间复杂度。

但将单词token化存在一个问题,就会使模型很难学习到有意义的输入表示,最直观的表示就是不能理解单词的含义。

当时Transformers有做过相应优化,比如一个复杂、不常见的单词分为一个有意义的token和一个独立token。

就像annoyingly就被分成“annoying”和“ly”,前者保留了其语义,后者则是频繁出现。

这也成就了如今ChatGPT及其他大模型产品的惊艳效果,能很好地理解人类的语言。

至于无法处理单词反转这样一个小任务,自然也有解决之道。

最简单直接的,就是你先自己把单词给分开喽~



或者也可以让ChatGPT一步一步来,先tokenize每个字母。



又或者让它写一个反转字母的程序,然后程序的结果对了。(狗头)



不过也可以使用GPT-4,实测没有这样的问题。



△实测GPT-4

总之,token就是AI理解自然语言的基石。

而作为AI理解人类自然语言的桥梁,token的重要性也越来越明显。

它已经成为AI模型性能优劣的关键决定因素,还是大模型的计费标准。

甚至有了token文学

正如前文所言,token能方便模型捕捉到更细粒度的语义信息,如词义、词序、语法结构等。其顺序、位置在序列建模任务(如语言建模、机器翻译、文本生成等)中至关重要。

模型只有在准确了解每个token在序列中的位置和上下文情况,才能更好正确预测内容,给出合理输出。

因此,token的质量、数量对模型效果有直接影响。

今年开始,越来越多大模型发布时,都会着重强调token数量,比如谷歌PaLM 2曝光细节中提到,它训练用到了3.6万亿个token。

以及很多行业内大佬也纷纷表示,token真的很关键!

今年从特斯拉跳槽到OpenAI的AI科学家安德烈·卡帕斯(Andrej Karpathy)就曾在演讲中表示:

更多token能让模型更好思考。



而且他强调,模型的性能并不只由参数规模来决定。

比如LLaMA的参数规模远小于GPT-3(65B vs 175B),但由于它用更多token进行训练(1.4T vs 300B),所以LLaMA更强大。



而凭借着对模型性能的直接影响,token还是AI模型的计费标准。

以OpenAI的定价标准为例,他们以1K个token为单位进行计费,不同模型、不同类型的token价格不同。

小米civi1s评测视频



总之,踏进AI大模型领域的大门后,就会发现token是绕不开的知识点。

嗯,甚至衍生出了token文学……



不过值得一提的是,token在中文世界里到底该翻译成啥,现在还没有完全定下来。

直译“令牌”总是有点怪怪的。

GPT-4觉得叫“词元”或“标记”比较好,你觉得呢?



参考链接:
[1]https://www.reddit.com/r/ChatGPT/comments/13xxehx/chatgpt_is_unable_to_reverse_words/
[2]https://help.openai.com/en/articles/4936856-what-are-tokens-and-how-to-count-them
[3]https://openai.com/pricing


返回网站首页

本文评论
HTC预告推出新款小型Vive VR头显_htc vive
当Meta和TikTok的所有者字节跳动为成为制造虚拟或增强现实硬件的高端社交媒体/元数据公司而战时,HTC正在提醒大家,它在游戏中也有一席之地。在没有提供任何额外细节的情况下,公...
日期:10-17
美国云计算上市公司_中国云企华云数据收购美国超融合厂商Maxta,开创科技并购先河
  一家中国的云计算厂商并购了一家美国领先的超融合厂商,这在当前的大环境下,感觉让人难以置信。   但,它却真实的发生了。   3月1日,中国云计算厂商华云数据宣布对国际...
日期:10-13
预付卡无证者遭遇商家封杀 或被监管“拉黑”
  有大型商家从9月1日始已不受理无牌照的预付卡,这类封杀会随着支付牌照的颁布进程进一步扩大。   央行与商务部联合展开的预付卡专项检查日前正式在全国各地铺开,违规卡...
日期:07-23
快手电商投诉「快手电商宣布上线客服举报功能2.0」
10月31日 消息:近日,快手电商宣布平台上线了客服举报功能,虽然举报成功后违规账号将被禁言72小时,但禁言失效后,仍受到持续骚扰,现结合商家的诉求,对举报功能做了2.0的升级。据悉,...
日期:11-09
搭载WebOS系统:惠普确认Slate平板电脑将于10月前上市_惠普windows平板
  台湾惠普公司的高层管理人员本周五在接受Digitimes网站采访时表示惠普Slate平板电脑将采用Palm公司的WebOS系统,这位高层人员表 示:“惠普Slate平板电脑将于10月份前上市...
日期:07-29
华为p50有翻新机吗「华为P50E官翻上架:2988享新机待遇」
华为官方翻新版华为P50E正式上架,该系列手机均配备8GB内存,提供128GB和256GB两种存储容量,售价分别为2988元和3288元。尽管是翻新机,但其可供选择的配色相当丰富,包括可可茶金、...
日期:04-26
深度评测:华为云新品HiLens Kit 性能如何?
  近期,华为云推出了一款自带摄像头的多模态AI开发套件,也是边缘AI图像推理硬件设备华为云 HiLens Kit。   HiLens Kit支持ISV、软硬件厂商和AI开发者进行AI应用开发,也可...
日期:09-02
变现经验 | 我开发了一个戒掉“手机依赖症”的APP 月入14万元「摆脱手机依赖症的app」
这是分享产品变现、开发者故事最新一期内容。“手机成瘾”已经成为当代很多人的通病,将很多时间浪费在玩手机上并影响了身心健康。国外开发者Martin Morávek (马丁 · 莫拉维...
日期:11-06
荣耀Q1手机出货量下跌35%,赵明:正向看待市场波动,全球市场成长速度快
出品 | 科技作者 | 张雅婷手机市场萧条依旧,连独立后来势汹汹的荣耀也“摔了一跤”。三星zflip2发布时间去年荣耀逆势增长的奇迹在今年并未重演。Canalys数据显示,去年一季度...
日期:06-02
TikTok 正测试 Win10/11 桌面版直播应用 TikTok Live Studio,挑战 Twitch
  12 月 16 日消息, TikTok 正在开发一款名为 TikTok Live Studio 的 Windows 桌面应用。   据了解,用户可以通过用他们的 TikTok 账号登录 TikTok Live Studio 进行直...
日期:01-07
iPhone4啥时候出的「iPhone SE4曝光:2024发布 用什么屏幕还没定」
中关村在线消息:近日,屏幕供应链人士Ross Young分享了一则有关iPhone 14的曝光,他表示第四代iPhone SE(以下简称iPhone SE4)将于2024年发布,目前苹果还没定下来该机将采用何种屏幕...
日期:11-04
沸沸扬扬的离婚案还没完 !王力宏将申请强制执行「王力宏否认离婚」
王力宏离婚案中,王力宏向法院申请强制执行。他希望法院能够强制执行他与前妻之间的离婚协议,以保障他的权益。王力宏表示,他与前妻已经就离婚一事达成了协议,但前妻未能按照协议...
日期:02-15
1加手机哪款性价比高「1加手机」
""是一家起源于中国的智能手机制造商。2013年4月,一加科技(OnePlus)成立,随后推出了第一款智能手机。这家公司以其高质量的产品和优秀的性能而备受消费者的追捧。在整个智能手机...
日期:05-30
性能对标MacBook!曝新的M2芯片iPad Pro将在“几天内”宣布_搭载m2芯片的macbook会涨价吗
Macrumors报道,苹果将在“几天内”宣布新的11英寸和12.9英寸iPad Pro型号,尊敬的彭博社记者马克古尔曼今天在他最新的Power On通讯中表示。华为mate 50 pro 最新消息代号为J61...
日期:10-20
加密劫持病毒现身苹果macOS:盗版软件成主要途径_mac装盗版windows
近日,安全威胁实验室Jamf Threat Labs发布报告,称在苹果macOS平台发现了一种新加密劫持病毒,该病毒通过盗版软件传播。根据Jamf Threat Labs报告的介绍,在该团队例行监控期间,收...
日期:02-25
Facebook手机项目负责人即将离职 研发或终止_facebook总工程师俞
Facebook手机项目负责人查马斯·帕里哈皮蒂亚(腾讯科技配图)  腾讯科技讯(中涛)北京时间6月4日消息,据美国科技博客网站Silicon Alley Insider(SAI)报道,Facebook副总裁、据称...
日期:07-28
腾讯又一手游没了!《街头篮球》国服宣布7月停服「腾讯街头篮球还有人玩吗」
快科技5月28日消息,近日腾讯旗下手游《街头篮球》官方宣布,游戏将在7月25日11点在国内停止运营。根据官方公告,具体停服规划如下:5月22日11点,停止游戏充值和新用户注册;7月25日11...
日期:05-28
腾讯QQ春节抢红包活动上线:百位知乎答主空降,奇趣脑洞题刷新认知
  新春将至,一年一度、最受欢迎的中华传统艺能活动“抢红包”也如约而来,各互联网大厂已陆续开启发红包、集福袋等新年活动,让网友们在APP间反复冲锋,越战越勇。   在今年...
日期:07-16
哈佛大学研发出一种更平价和高效的空调方法「哈佛大学研发出一种更平价和高效的空调」
夏天的命都是空调给的。这句话正从梗变成现实。在今年的高温下,空调变得越来越必要,但同时,空调用得越多,既会加重用电电压力,而排出的热气也会让户外环境更热,制冷剂也会对环境...
日期:09-14
2022年美国电动汽车销量飙升2/3,特斯拉领先优势缩小_美国新能源车销量
1月7日消息,市场研究公司Motor Intelligence发布的最新报告显示,尽管2022年美国整体汽车市场出现萎缩,但电动汽车销量飙升了三分之二。同时,传统汽车制造商推出大量混合动力车型...
日期:01-07