您的位置:首页 > 互联网

三项根本性新能力最为关键-网易有道CEO周枫谈大语言模型_有道创始人周峰

发布时间:2023-10-01 20:31:00  来源:互联网     背景:

近日,网易有道CEO周枫在个人公众号发文,探讨大语言模型技术带来的三项根本性新能力。他指出,在大模型带来的新能力中,涌现能力、作为基座模型支持多元应用的能力和支持对话作为统一入口的能力最为关键,可能给业界和产品带来长期影响,值得重点关注。

极品飞车ngc

以下为内容全文:

基于大语言模型技术的ChatGPT推出已经有4个月了,更多同类产品还在快速出现。比如,前天谷歌更新了Bard,将辅助编程能力支持的语言数量扩展到20种。

然而,对大模型技术的重要性也出现了质疑,前段时间,吴军老师就评价ChatGPT不算新技术革命,带不来什么新的机会,他认为大模型仍然存在很多限制,不像大家追捧的那样有吸引力。这篇文章发布后,网上也出现了多篇反驳文章。我不太关注这些争论,但我认为有一个问题没有被充分讨论,那就是大模型带来的新能力中,哪些是最为关键的,最有可能带来长期影响的。

我认为,与之前众多的自然语言处理技术相比,大语言模型至少具有三项根本性新能力,这些新能力在学术界已经被广泛讨论,甚至被视为常识,但是在产业界和产品团队中却缺乏足够的关注。实际上,这些大模型技术的特点已经改变了我们对业务和产品规划的思考方式,也会改变很多产品的经济模型。因此,产品经理和业务负责人需要更多地关注和深入思考这些新能力的应用场景。

ps5手柄玩steam效果和ps5一样吗

能力一:涌现能力(emergent abilities)

涌现能力指的是在小型模型中并不存在,但在大模型中“突然出现”的能力,其中包括常识推理、问答、翻译、数学、摘要等(详见下图)。如果仅依靠小型模型的能力做线性外推,往往无法预测出涌现能力的出现和其强度。OpenAI的首席技术官Ilya Sutskever在接受采访时反复强调,尽管表面上看来,语言模型只是在预测下一个词元(token),但当模型足够大,transformer技术的建模能力足够强时,基于内部表示的推理能力就会出现。因此,模型会呈现出与规模较小时完全不同的行为,涌现全新的能力。

涌现能力之所以重要,不仅因为它们是大模型出现后才有的新能力,而且由大模型涌现出来的多数是非常重要的能力。例如,常识推理能力一直是AI领域的重大难题,而大模型的出现使得常识推理取得了重大进展。此外,大模型还有机会进一步获得更多能力。例如,一旦“推理”能力涌现,“思维链提示”(Chain of Thought Prompting)策略就可以用来解决多步推理的难题。因此,涌现能力的出现,是大模型带来的一项根本性变化。

能力二:作为基座模型支持多元应用的能力

在2021年,斯坦福大学等多所高校的研究人员提出了基座模型(foundation model)的概念,这更清晰地描述了之前学界所称的预训练模型的作用。这是一种全新的AI技术范式,借助于海量无标注数据的训练,获得可以适用于大量下游任务的大模型(单模态或者多模态)。这样,多个应用可以只依赖于一个或少数几个大模型进行统一建设。

小数的加减法教学反思

网易有道旗下的课程产品

上图展示了基座模型的结构,基座模型集中化了多模态数据,并且可以适配多元化的下游任务。

大语言模型是这个新模式的典型例子,使用统一的大模型可以极大地提高研发效率,相比于分散的模型开发方式,这是一项本质上的进步。大型模型不仅可以缩短每个具体应用的开发周期,减少所需人力投入,也可以基于大模型的推理、常识和写作能力,获得更好的应用效果。因此,大模型可以成为AI应用开发的大一统基座模型,这是一个一举多得、全新的范式,值得大力推广。

能力三:支持对话作为统一入口的能力

让大语言模型真正火爆的契机,是基于对话聊天的ChatGPT。事实上,业界很早就发现了用户对于对话交互的特殊偏好,陆奇在微软期间2016年就推进“对话即平台(conversation as a platform)”的战略。此外,苹果Siri、亚马逊Echo等基于语音对话的产品也非常受欢迎,反映出互联网用户对于聊天和对话这种交互模式的偏好。虽然之前的聊天机器人存在各种问题,但大型语言模型的出现再次让聊天机器人这种交互模式可以重新想象。用户愈发期待像钢铁侠中“贾维斯”一样的人工智能,无所不能、无所不知。这引发我们对于智能体(Agent)类型应用前景的思考,Auto-GPT、微软Jarvis等项目已经出现并受到关注,相信未来会涌现出很多类似的以对话形态让助手完成各种具体工作的项目。

有道创始人周峰

图为微软最新项目Jarvis的工作流程,Jarvis将通过任务规划、模型选择、任务执行、生成响应四个步骤,结合HuggingFace上的众多模型,完成多模态的复杂AI任务。

随着大型语言模型技术越来越受欢迎,我们可以期待它带来更多的惊喜,特别是考虑到上面讨论的这些大型模型带来的关键新能力,周明等人所预测的语言智能黄金十年(2020-2030)很可能会成为现实,这正是一个令人兴奋的时代。


返回网站首页

本文评论
大数据发展特征、最新实践与启示建议_大数据发展的特点
通信世界网消息(CWW)我国大数据产业发展持续提速,数据基础制度建设提速、技术融合应用创新加速、产业链分工细化市场竞争加剧等因素驱动大数据产业步入新的发展阶段,对企业大数...
日期:10-25
CES:汽车制造商纷纷展示车载娱乐和游戏_ces奔驰概念车
1月6日消息,大众、本田和现代等汽车制造商在2023年度国际消费电子展(CES)上相继推出全新的车载娱乐系统,其中不乏车内视频游戏功能。埃隆·马斯克(Elon Musk )起初向特斯拉车主们...
日期:01-07
硬刚特斯拉!Lucid将推5万美元以下新车:竞争入门级市场_特斯拉新suv
快科技12月26日消息,据外媒报道,美国新势力Lucid汽车的CEO在接受采访时表示:将在2024年推出一款售价在5万美元以内的入门级车型。作为特斯拉在美国最强的竞争对手,Lucid此次推出...
日期:12-27
一加 8t ace2「一加Ace 3曝光:搭载3.2GHz骁龙8 Gen 2」
近日,博主@数码闲聊站爆料称,一加将推出一款搭载3.2GHz骁龙8 Gen 2处理器的新机。该机正面配备6.74英寸左右的1.5K高频调光单孔微弧柔性屏,机身内置5500mAh左右的电池,支持100W...
日期:09-05
白宫或迫使 AWS、微软、谷歌云等:披露 AI 客户信息
据了解即将“颁布的 AI 行政令”的知情人士透露,白宫正考虑要求云计算公司向美国政府报告其客户的一些信息。微软 contractor这项条文将由美国商务部制定规则,从而迫使微软、...
日期:10-07
pikapika testflignt「Pika 1.0官网地址是多少 Pika内测申请地址入口」
近日,AI初创公司Pika Labs正式发布了其令人印象深刻的AI视频生成器的1.0版本,为视频创作带来了全新的体验。(Pika内测申请地址入口见文末)Pika1.0不仅能通过文字生成非常贴近且...
日期:12-01
闺蜜被抢「女子当面抢走闺蜜6万元首饰 网友:我大受震撼」
近日,一名网名为“乐瑶”的女子购买了 6 万元的金银首饰,却意外成为好闺蜜“心瑶”的目标。乐瑶兴奋地在朋友圈炫耀新购首饰,引起了好闺蜜的贪念。心瑶找了借口前来试戴首饰,本...
日期:11-15
Facebook支付系统更名为Meta Pay_facebook改用户名
  5月14日消息(刘文轩)为推动“元宇宙”为中心的商业模式,由Facebook更名的meta公司本周宣布支付系统品牌也由“Facebook Pay”更名为“meta Pay”,同时还透露了单一电子...
日期:07-18
通用汽车现在进入了能源行业的原因「通用汽车现在进入了能源行业」
通用汽车公司正在向房主、企业和公用事业部门推出新的能源产品系列,这是电动汽车攻势的下一步,目的是在制造和销售电动汽车之外创造收入,并直接针对特斯拉。下列属于蜂窝通信技...
日期:10-14
继罗永浩,报道称刘畊宏夫妇将开启淘宝直播「淘宝罗永浩直播间」
10月28日 消息:继罗永浩入驻淘宝直播之后,有报道称刘畊宏夫妇也将开启淘宝直播。据新浪科技报道,又一位抖音头部达人刘畊宏及妻子ViVi将于近日入驻淘宝直播,并于10月31日双11开...
日期:10-28
绿源、松果牌部分电动自行车召回 原因均是后尾灯反光
与汽车类似,电动自行车作为消费品,出现质量或者其它合规性问题,也需要被召回。今日,国家市场监督管理总局官网显示,天津信和恒业智能科技有限公司主动进行产品召回,自即日起,召回20...
日期:12-09
风投公司:受生成式AI影响最大的行业将是视频游戏「风投软件」
4月10日 消息:风险投资公司 Andreessen Horowitz 认为,受生成人工智能影响最大的行业将是视频游戏。据《经济学人》报道:游戏的交互性要求它们充满精心设计的内容,想想最近的...
日期:04-10
小鹏电动智能汽车「小鹏全新入门品牌明年上市:定位15万级智能电车」
快科技11月14日消息,据媒体报道,小鹏汽车收购滴滴智能汽车开发业务已在11月13日进行了首次交割。按照股份购买协议,小鹏汽车公司已向滴滴配发及发行58,164,217股A类普通股作为...
日期:11-14
日本因疫情取消中国航班「日本两家航司宣布取消103架次在羽田机场起降的航班」
据日本航空、全日空两家航空公司当地时间1月4日公布,受东京羽田机场飞机相撞事故影响,当天,两家航司共取消103架次在羽田机场起降的航班,约有超2万名旅客出行受到影响。华为mate...
日期:01-05
创客匠人带你三步打造爆款知识付费产品_创客匠人产品的亮点
  知识付费行业的火爆,让越来越多的人关注于"学习"。从一开始的不愿付费到现在的愿意对高质量、服务更好的内容付费,显然这样能更加有效地节省用户的信息选择时间成本和金...
日期:07-25
放了7天假,比上班还累「过这个假期比上班还累」
声明:本文来自于微信公众号 深燃(ID:shenrancaijing),作者 | 邹帅 编辑 | 唐亚华,授权转载发布。七天长假结束,七天工作日开始了。不过,对于一部分人来说,他们的“工作”刚刚结束,“...
日期:10-09
马斯克为什么要删推特「马斯克将于10月6日和7日就推特收购案接受推特律师询问」
9月28日消息,据国外媒体报道,一份法庭文件显示,特斯拉CEO埃隆·马斯克将于当地时间10月6日和7日上午在特拉华州威尔明顿的波特·安德森和科罗恩(Potter AndersonCorroon)律师事务...
日期:10-04
新闻聚合网站Reddit创始人上演王者归来
  4月27日讯,新闻聚合网站Rettit的联合创始人Alexis Ohanian今天宣布他将重新回到Rettit网站担任网站的顾问。   Alexis Ohanian在2006年把Reddit网站卖给Condé Nast公...
日期:07-27
苹果计划为 iPhone 16 升级麦克风以改善 AI 增强的 Siri 体验_ios15麦克风功能设置
12 月 8 日消息:根据苹果分析师郭明錤的说法,苹果计划对 iPhone 16 的麦克风进行重大升级,以提升全新的 AI 增强 Siri 体验。郭明錤在他最新的 Medium 博客文章中写道:加强 Sir...
日期:12-08
中国联通重磅发布5G超可靠低时延汽车柔性产线_中国联通5g规划
通信世界网消息(CWW)6月14日-16日,由工业和信息化部、江苏省人民政府主办的2023工业互联网大会在苏州召开。中国联通以“工业互联 智造未来”为主题亮相大会,工业与信息化部副部...
日期:06-19