您的位置:首页 > 互联网

google speech api「谷歌 PaLM 2训练所用文本数据量是初代的近5倍」

发布时间:2023-05-17 15:39:19  来源:互联网     背景:

5月17日消息,谷歌上周在2023年I/O开发者大会上推出最新大型语言模型PaLM 2。公司内部文件显示,自2022年起训练新模型所使用的文本数据量几乎是前一代的5倍。

据悉,谷歌最新发布的PaLM 2能够执行更高级的编程、运算和创意写作任务。内部文件透露,用于训练PaLM 2的token数量有3.6万亿个。

所谓的token就是字符串,人们会将训练模型所用文本中的句子、段落进行切分,其中的每个字符串通常被称为token。这是训练大型语言模型的重要组成部分,能教会模型预测序列中接下来会出现哪个单词。

鸿蒙系统3.0北斗卫星发信息

谷歌于2022年发布的上一代大型语言模型PaLM在训练中使用了7800亿个token。

尽管谷歌一直热衷于展示其在人工智能技术领域的实力,说明如何将人工智能嵌入到搜索引擎、电子邮件、文字处理和电子表格中,但一直不愿公布训练数据的规模或其他细节。微软支持的OpenAI也对最新发布的GPT-4大型语言模型细节保密。

谷歌nlp

两家公司都表示,不披露这些信息的原因是人工智能行业存在激烈竞争。谷歌和OpenAI都想要吸引那些希望使用聊天机器人而不是传统搜索引擎搜索信息的用户。

但随着人工智能领域竞争的白热化,研究界要求提高透明度。

自推出PaLM 2以来,谷歌一直表示,新模型比之前的大型语言模型更小,这意味着该公司技术在完成更复杂任务时能变得更高效。参数(parameters)通常用于说明语言模型的复杂性。根据内部文件,PaLM 2接受了3400亿个参数的训练,初代的PaLM接受了5400亿个参数的训练。

谷歌没有立即发表评论。

谷歌在一篇关于PaLM 2的博客文章中表示,新模型使用了一种名为“计算最优缩放”(compute-optimal scaling)的“新技术”,能使得PaLM 2“更高效,整体性能更好,比如推理更快、服务参数更少,服务成本也更低。”

在发布PaLM 2时,谷歌透露新模型接受了100种语言的训练,并能胜任各种各样的任务。包括谷歌试验性聊天机器人Bard在内的25项功能和产品用的都是PaLM 2。PaLM 2按参数规模有四个不同的版本,从小到大依次是Gecko(壁虎)、Otter(水獭)、Bison(野牛)和Unicorn(独角兽)。

夜拍效果好的千元手机

根据谷歌公开披露的信息,PaLM 2比任何现有模型都更强大。Facebook在今年2月份宣布推出名为LLaMA的大型语言模型,其在训练中用了1.4万亿个token。OpenAI发布GPT-3时披露了相关训练规模,当时公司表示,这一模型接受了3000亿个token的训练。今年3月份,OpenAI发布新模型GPT-4,并表示在许多专业测试中表现出“人类水平”。

根据最新文件,谷歌两年前推出的语言模型接受了1.5万亿个token的训练。

随着新的生成式人工智能应用迅速成为科技行业主流,围绕底层技术的争议也越来越激烈。

今年2月份,谷歌研究部门高级科学家埃尔·马赫迪·埃尔·马哈迪(El Mahdi El Mhamdi)因公司缺乏透明度而辞职。周二,OpenAI首席执行官萨姆·奥尔特曼(Sam Altman)在美国参议院司法小组委员会关于隐私和技术的听证会上出庭作证,也同意用新系统来应对人工智能。

“对于一项非常新的技术,我们需要一个新的框架,”奥尔特曼说,“当然,像我们这种公司对自己推出的工具负有很大责任。”(辰辰)


返回网站首页

本文评论
下游拉货力道放缓,三大芯片市场显现降温
  随着大尺寸面板、Chromebook 和手机等终端客户拉货力道放缓,电子行业近期传出,驱动 IC、触控与驱动整合 IC(TDDI),以及电源管理 IC 等三大芯片市场正在降温。   据台媒...
日期:07-17
数学学不好!要“对症下药”,阿尔法蛋大蛋2.0帮助精准找弱项(阿尔法蛋怎么辅导数学题)
  在大多数家长眼中,给孩子辅导数学就是梦魇,我们家也是如此。孩子今年上四年级了,数学那是一塌糊涂。老师教的跟不上,回家复习就跟看天书一样,给他买辅导书刷题没有用,报班补...
日期:07-14
2023小蛮腰科技大会 探寻AIGC新未来
ChatGPT的爆火,刷新了人类对AI的认知,作为AIGC(即AI Generated Content,利用人工智能技术来生成内容)赛道的典型代表,为整个产业带来了大风口。人工智能会对各行业的发展带来怎样...
日期:04-13
iFixit 拆解显示苹果 AirPods Pro 2 与上代一样几乎无法修复_AirPods二代拆机
9月29日消息:拆解维修网站iFixit今天分享了一段苹果第二代AirPods Pro的拆解视频,提供了对新耳塞和充电盒内部的近距离观察。拆解结果证实,AirPods Pro在很大程度上仍然无法维...
日期:09-30
为什么我搜索的时候选择框「当搜索框用上 ChatGPT」
声明:本文来自于微信公众号 航通社(ID:lifeissohappy),作者:书航,授权转载发布。谷歌电脑版首页的格局,是和别处不同的:在搜索框旁边有两个按钮,而不是一个。在常规搜索按钮的右边...
日期:02-09
支付交易宝邮件_骗取支付宝账户的邮件解析
  今天收到一封窃取支付宝账户信息的邮件,内容如图,有几个要点值得注意:   1、在邮箱里面,他写了亲爱的***,是我的真名,   2、提示你账户已经被提现,并让你去修改密码。  ...
日期:07-24
蔚来十万辆下线「蔚来部分车型降10万?官方回应:仅是少量展车、库存车」
凤凰网科技讯 2月2日消息,蔚来回应凤凰网科技,蔚来2022款ES8、ES6和EC6车型即将迎来全新换代,目前还有少量展车和库存车可供销售,这部分车辆可以享受展车政策。蔚来日常有置换政...
日期:02-02
武汉经销商的自述:直播卖车可能是最好的“自救”方法_武汉卖车骗局
  “我们现在身处武汉门都出不了,如果不做直播卖车,我们又能做什么呢?”这是魏爽最近的困惑,却也是他的收获。   魏爽是武汉市上汽名爵品牌一家4S店的总经理,按照以往规律,...
日期:10-02
华为智慧屏 S3 Pro上线 超强智慧双芯 起售价5999元「华为智慧屏s s pro」
2023 年 4 月 17 日,华为智慧屏 S3 Pro正式发布。作为今年首 款智慧屏新品,华为智慧屏 S3 Pro在产品性能、智慧体验以及外观上实现全方位提升。不仅搭载全新智慧双芯,让性能、...
日期:04-20
雅虎下一站:创新无路 收购或成终局_雅虎收购案
  尝试三年,雅虎仍未找到出路。依然困守在门户时代商业模式的雅虎如今仍选择了数字媒体公司的角色。业内分析认为,倚重亚洲资产选择被收购或许是这家公司的出路。   雅虎...
日期:07-22
锐龙7000御用平台 微星4款X670主板开卖:顶配8999元_锐龙7 5800x核显
AMD昨晚发布了锐龙7000处理器,这一代不仅升级了5nm Zen4架构,还带来了全新的AM5平台及600系芯片组,今晚高端的X670系列也上市了,微星推出了4款X670系列主板,其中最豪华的MEG X670...
日期:10-01
AMD Zen4锐龙处理器在国内偷跑开卖:旗舰7950X卖5999元「锐龙zen4架构」
赶在27号正式发售前,AMD锐龙9 7950X的散片已经在某“海鲜市场”出现,标价5999元包邮。和盒装行货5950X当前3799元的价格比,的确是贵上不少。同时,考虑到7950X的官价699美元比595...
日期:09-21
送女神礼物挠破头?桔多多女王节为您解烦忧
  阳春三月,一个被称为“最有魅力”的节日即将来临,它就是“女王节”。有人说,“女王节”是春天女孩子对自己最好的犒劳,而对于男生来说,这一天似乎又充满了纠结,究竟该送给她...
日期:07-16
黑格科技3D打印助力和平精英开启“云游”之旅_黑格智造
近日,《和平精英》绿洲世界上线,更在未来中心打造了一场让每个玩家云游的数字新品大赏。不仅如此,和平精英还带来了穿越虚实的体验,限定礼盒套装“云游空投”,为游戏玩家“特种兵...
日期:04-29
支付宝 失业保险_支付宝上线申领失业保险待遇
  8月12日消息 为切实做好疫情防控期间参保失业人员基本生活保障,确保失业保险待遇按时足额发放,国家人社部加速推进失业保险待遇网上申领工作。人社部表示,失业保险金和失...
日期:07-15
华为抢先苹果支持卫星通信!全球首颗北斗短报文SoC芯片进入量产_华为与北斗卫星合作
在华为和苹果的带动下,“卫星通信”成为最近热议的话题之一,业内猜测,华为将携手北斗三号系统实现手机卫星通信技术的大众化应用。日前,国内独立第三方集成电路测试技术服务商利...
日期:09-06
干式变压器介绍「SGB干式变压器解决方案助力高高原机场建设」
2022年12月底,山南隆子机场正式通航。SGB为该项目配置了SGB环氧树脂浇注干式变压器解决方案,为机场安全可靠用电全力护航。乐视网财务总监张巍山南隆子机场(Shannan Longzi Air...
日期:02-25
深信服EDS存储助力海通期货夯实数据根基
  从早期的交易信息留存,到为客户开发、交易指导、风险控制提供决策支持,期货行业的数据在如今的数字时代迸发出了极大的能量。作为期货行业的领先者,海通期货多年以来为投...
日期:07-16
腾讯引领Real-time时代前瞻 跨媒多触点营销纵横广告节(腾讯广告活动)
  第十八届中国国际广告节已于9月底闭幕,长城奖、艾菲奖、媒介创新奖、网络广告创意奖等奖项作为本届广告节的重头戏,也已颁发完毕。当前,各家或正在用奖项自我标榜“最大赢...
日期:07-23
周边遭疯抢,《流浪地球2》怎样成为2023第一个国民IP?_2023年流浪地球
声明:本文来自于微信公众号 刺猬公社(ID:ciweigongshe),作者:世昕 欧阳 园长,授权转载发布。可能演员宁理都没有想到,自己在《流浪地球2》里饰演的角色马兆会火的一塌糊涂,甚至被...
日期:02-08