您的位置:首页 > 互联网

周枫谈大语言模型:三项根本性新能力最为关键

发布时间:2023-04-23 17:41:45  来源:互联网     背景:

【网易科技4月23日报道】近日,网易有道CEO周枫在个人公众号发文,探讨大语言模型技术带来的三项根本性新能力。他指出,在大模型带来的新能力中,涌现能力、作为基座模型支持多元应用的能力和支持对话作为统一入口的能力最为关键,可能给业界和产品带来长期影响,值得重点关注。

ipadpro是c口吗

以下为内容全文:

基于大语言模型技术的ChatGPT推出已经有4个月了,更多同类产品还在快速出现。比如,前天谷歌更新了Bard,将辅助编程能力支持的语言数量扩展到20种。

然而,对大模型技术的重要性也出现了质疑,前段时间,吴军老师就评价ChatGPT不算新技术革命,带不来什么新的机会,他认为大模型仍然存在很多限制,不像大家追捧的那样有吸引力。这篇文章发布后,网上也出现了多篇反驳文章。我不太关注这些争论,但我认为有一个问题没有被充分讨论,那就是大模型带来的新能力中,哪些是最为关键的,最有可能带来长期影响的。

我认为,与之前众多的自然语言处理技术相比,大语言模型至少具有三项根本性新能力,这些新能力在学术界已经被广泛讨论,甚至被视为常识,但是在产业界和产品团队中却缺乏足够的关注。实际上,这些大模型技术的特点已经改变了我们对业务和产品规划的思考方式,也会改变很多产品的经济模型。因此,产品经理和业务负责人需要更多地关注和深入思考这些新能力的应用场景。

能力一:涌现能力(emergent abilities)

涌现能力指的是在小型模型中并不存在,但在大模型中“突然出现”的能力,其中包括常识推理、问答、翻译、数学、摘要等(详见下图)。如果仅依靠小型模型的能力做线性外推,往往无法预测出涌现能力的出现和其强度。OpenAI的首席技术官Ilya Sutskever在接受采访时反复强调,尽管表面上看来,语言模型只是在预测下一个词元(token),但当模型足够大,transformer技术的建模能力足够强时,基于内部表示的推理能力就会出现。因此,模型会呈现出与规模较小时完全不同的行为,涌现全新的能力。

涌现能力之所以重要,不仅因为它们是大模型出现后才有的新能力,而且由大模型涌现出来的多数是非常重要的能力。例如,常识推理能力一直是AI领域的重大难题,而大模型的出现使得常识推理取得了重大进展。此外,大模型还有机会进一步获得更多能力。例如,一旦“推理”能力涌现,“思维链提示”(Chain of Thought Prompting)策略就可以用来解决多步推理的难题。因此,涌现能力的出现,是大模型带来的一项根本性变化。

能力二:作为基座模型支持多元应用的能力

在2021年,斯坦福大学等多所高校的研究人员提出了基座模型(foundation model)的概念,这更清晰地描述了之前学界所称的预训练模型的作用。这是一种全新的AI技术范式,借助于海量无标注数据的训练,获得可以适用于大量下游任务的大模型(单模态或者多模态)。这样,多个应用可以只依赖于一个或少数几个大模型进行统一建设。


上图展示了基座模型的结构,基座模型集中化了多模态数据,并且可以适配多元化的下游任务。

大语言模型是这个新模式的典型例子,使用统一的大模型可以极大地提高研发效率,相比于分散的模型开发方式,这是一项本质上的进步。大型模型不仅可以缩短每个具体应用的开发周期,减少所需人力投入,也可以基于大模型的推理、常识和写作能力,获得更好的应用效果。因此,大模型可以成为AI应用开发的大一统基座模型,这是一个一举多得、全新的范式,值得大力推广。

小米MIX Fold价格

能力三:支持对话作为统一入口的能力

长安uni高端轿车

让大语言模型真正火爆的契机,是基于对话聊天的ChatGPT。事实上,业界很早就发现了用户对于对话交互的特殊偏好,陆奇在微软期间2016年就推进“对话即平台(conversation as a platform)”的战略。此外,苹果Siri、亚马逊Echo等基于语音对话的产品也非常受欢迎,反映出互联网用户对于聊天和对话这种交互模式的偏好。虽然之前的聊天机器人存在各种问题,但大型语言模型的出现再次让聊天机器人这种交互模式可以重新想象。用户愈发期待像钢铁侠中“贾维斯”一样的人工智能,无所不能、无所不知。这引发我们对于智能体(Agent)类型应用前景的思考,Auto-GPT、微软Jarvis等项目已经出现并受到关注,相信未来会涌现出很多类似的以对话形态让助手完成各种具体工作的项目。


图为微软最新项目Jarvis的工作流程,Jarvis将通过任务规划、模型选择、任务执行、生成响应四个步骤,结合HuggingFace上的众多模型,完成多模态的复杂AI任务。

随着大型语言模型技术越来越受欢迎,我们可以期待它带来更多的惊喜,特别是考虑到上面讨论的这些大型模型带来的关键新能力,周明等人所预测的语言智能黄金十年(2020-2030)很可能会成为现实,这正是一个令人兴奋的时代。

为什么一到天冷就尿频


返回网站首页

本文评论
知乎如何将情怀做成一门好的生意?_知乎 一笔生意
  文/Alex   来源:锐问 Record(ID:tigerrecord)   成立10年,知乎终于要上市了,第一次摊开自己的账簿。   2020年第四季度,每个月平均有7570万人在知乎上提问题,找答案。...
日期:07-16
Win11 Dev 开发频道的 Windows Insider 用户已可测试运行 Android 应用
  11 月 5 日消息,微软官方 Windows Insider 账号于当地时间 11 月 5 日在 Twitter 上宣布,现阶段 Windows Dev 开发频道的 Windows Insider 用户也可在 Windows 11 系统上...
日期:07-17
苹果新款第十代 iPad 的 USB-C 接口比其他型号更慢_ipad usb-c转usb
10月28日消息:与最新的 iPad Pro、iPad Air 和 iPad mini 等机型相比,苹果新的第 10 代 iPad 配备了较慢的 USB-C 接口。正如 The Verge 在本周发布的新 iPad 评测中指出的那...
日期:10-30
我国首颗太阳专用卫星 夸父一号观测数据将向国内外试开放_太阳监测卫星计划叫夸父计划
快科技4月12日消息,中国科学院紫金山天文台宣布夸父一号观测数据将向国内外试开放。2023年4月11至12日,由夸父一号”卫星工程科学应用系统牵头单位中国科学院紫金山天文台、地...
日期:04-13
gmail Google_Google+最新更新将出现在Gmail联系人栏目中
新浪科技讯 北京时间8月24日凌晨消息,据美国计算机杂志《电脑世界》(PCWorld)网络版报道称,谷歌将支持Google+最新更新出现在Gmail联系人栏目(Gmail people widget)中的功能...
日期:07-22
三合一高效快充!贝尔金新款无线充电板上架 1098元「贝尔金双口充电器」
11月5日消息,苹果官网目前上架了贝尔金新款无线充电板,可用于iPhone、Apple Watch、无线耳机等设备充电,售价为1098元。三星手机在印度一加3最新售价据悉这款充电板可为iPhone...
日期:11-13
真我10系列官宣:全球首发2160Hz顶级护眼屏 11月9日见
今日晚间,真我宣布将于11月9日在印度举行新品发布会,正式发布真我10系列新品。此前真我副总裁徐起确认,真我10系列也会在国内发布,该机目前已经获得入网许可,共有真我10、真我10...
日期:11-03
服务器被挤崩 复旦MOSS回应:模型还非常不成熟 只是想内测「复旦服务器地址」
2月21日消息,昨日,复旦团队发布国内首个类ChatGPT模型MOSS,引发网友关注。由于瞬时访问压力过大,MOSS服务器当晚被挤崩。小米电视新时代怎么看直播是您居家必备送礼首选今日,MOSS...
日期:03-01
小红书急等「2000万」「小红书3499」
声明:本文来自于微信公众号 壹娱观察(ID:yiyuguancha),作者:厚码,授权转载发布。一则小红书商业化负责人之恒将于近期离职的消息在媒体圈刷屏。2020年3月,之恒加入小红书,加盟前曾...
日期:03-11
摆脱高通依赖!苹果自研5G基带已在路上:最快2025年登场
快科技4月14日消息,据MacRumors报道,苹果自研5G基带最快会在2025年量产商用,届时苹果会拜托对高通公司的依赖。分析师郭明錤指出,测试苹果5G基带的是iPhone SE 4早期原型机,苹果...
日期:04-14
深耕卡牌玩法,游族网络少年系列产品持续发力_卡牌互动游戏
  近日,游族网络旗下产品《少年三国志2》可谓动作频频,2月《少年三国志2》全平台流水超过3.5亿元,在伽马数据发布的《2020年2月移动游戏报告》中顺利跻身流水测算榜TOP10...
日期:03-24
芯片股暴跌_又见“雪崩”,芯片价格为何总是暴涨暴跌?
记者/彭新   消费电子市场需求的持续减弱,曾在上半年引发过一波芯片急跌,而近日多款芯片报价“雪崩”,让半导体供应问题再度成为行业焦点。   据央视新闻报道,作为电子控制...
日期:08-21
2022最后一场大流星雨!双子座流星雨来了:肉眼可见_双子座流星雨将至
希望对着流星雨许愿的网友注意了,明晚天空将上演一场夜空礼花”双子座流星雨。红米k60最新消息lol世界赛s1据北京天文馆消息,12月14日将迎来双子座流星雨的极大值,这也是本年度...
日期:12-13
华为诉讼美国_华为回应美法官驳回禁购诉讼:考虑采取进一步法律行动
  据环球时报报道,得克萨斯州东区地方法院法官马赞特18日在裁决书中称,美国国会有权禁止联邦机构购买华为的产品。该法官在长达57页的裁决书中表示,与联邦政府签订合约是一...
日期:03-19
蓝瀚互动荣获2019中国新经济创新势力榜“最佳出海营销平台”大奖
  继2019年1月的“中国新经济创新势力榜”之电商零售榜、交通出行榜、文化娱乐榜评选启动后,艾媒咨询主办的“2019中国新经济创新势力榜”评选再次启幕。在本次评选中,作为...
日期:03-18
旅游加盟店赚钱吗「谁还在抢着做「旅游」这门苦生意?」
声明:本文来自于微信公众号 真探AlphaSeeker(ID:deep_insights),作者:李静林,授权转载发布。旅游生意不好干已不是什么新闻。根据文旅局发布的数据,2022年上半年国内旅游总人次为...
日期:10-01
iFixit 拆解显示苹果 AirPods Pro 2 与上代一样几乎无法修复「苹果airpods pro拆机」
9月29日消息:拆解维修网站iFixit今天分享了一段苹果第二代AirPods Pro的拆解视频,提供了对新耳塞和充电盒内部的近距离观察。拆解结果证实,AirPods Pro在很大程度上仍然无法维...
日期:10-01
下班玩VR绘画两个月,我接到近万元的商单
声明:本文来自微信公众号“新榜”(ID:newrankcn),作者:卷毛,编辑:张洁,xx,授权转载发布。最近艺术领域又卷出一条新赛道——VR绘画。一般人可能玩了两局VR游戏就闲置了,而国内外已经...
日期:02-06
ibm有多少专利「IBM去年在美申请专利锐减44%,回应:申请耗时,不再追求数量」
1月7日消息,专利分析服务公司Harrity LLP最新发布的“专利300榜单”(Patent 300)显示,2022年IBM专利数量下降44%至4743项,公司失去在美国专利申请领域维持几十年的领先地位。而同...
日期:01-07
国美电器多个破产申请被驳回 苏泊尔在列_国美电器总资产
凤凰网科技讯 2月8日消息,据天眼查App显示,近日,国美电器有限公司新增多个破产审查案件,申请人沈阳盛兴达厨卫用品有限公司、哈尔滨苏泊尔炊具销售有限责任公司、长春苏泊尔炊具...
日期:02-08