您的位置:首页 > 媒体评论

ChatGPT火了 中国人工智能圈有点上火

发布时间:2023-02-03 02:04:03  来源:互联网     背景:

春节前,人工智能组织OpenAI推出的大模型ChatGPT,惊艳四座。这让中国人工智能圈“有点上火”。国内业界在迅速反思和行动:我们的差距在哪里?我们将如何正视和改进不足?哪些又是中国从业者的机会?

文|赵艳秋 徐鑫

编|周路平

春节前,人工智能组织OpenAI推出的大模型ChatGPT,在国内业界引起了不小的轰动。

一名AI从业者告诉数智前线,人工智能每五六年都有一波浪潮,上一波AlphaGO让大家震撼,这一波就是ChatGPT。但这两次大家的心态迥然不同,当谷歌的AI下棋战胜围棋世界冠军时,大家当新闻看,但这一次许多人是从消费者的角度来体验它。一个月里,全世界100万用户在使用和体验它,这是非常颠覆性的体验。这也是AI第一次大规模的自传播。

数智前线获悉,除了感叹于ChatGPT的惊艳体验外,国内业界也在迅速反思和行动:我们的差距在哪里?我们将如何正视和改进不足?哪些是中国从业者的机会?

一名从业人士告诉数智前线,ChatGPT出现后,行业重新变得热闹而有活力,前几年青黄不接、垂头丧气的局面一扫而空。

01.中美差距究竟有多大

在ChatGPT推出后,一位百度资深人士告诉数智前线,他“没有兴趣”谈论ChatGPT,言语之间,五味杂陈。一位人工智能企业创始人称,面对ChatGPT的惊艳表现,心痒痒也迷茫,失眠了。他坦承,从模型的规模到效果,差距还比较远。

有人用同样的问题向国内某厂商的大模型和ChatGPT同时发问,ChatGPT从回答的逻辑性和完整度上都远超国内大模型,国内大模型的答案带有明显的拼凑感,夹杂着不少主题之外的胡编内容。而且,在回复速度上,ChatGPT也领先一截。

从事数字人研发的特看科技CEO乐乘认为,目前全球还没有能跟ChatGPT抗衡的大模型,业界共识是差距在两年以上。国内先不谈弯道超车,趁早追赶反而是更重要的。

虽然一些人工智能资深人士认为,在ChatGPT所涉及的技术上,中美是“平级”的,但华为诺亚方舟实验室语音语义首席科学家刘群,在黄大年茶思屋的讨论中坦承,中国在技术上还是有差距的。其中一个是基础模型本身的差距,虽然我们训练了很多万亿模型或者是几千亿的模型,但训练的充分程度,是远远不够的。“我估计到现在为止,没有哪个模型能吃GPT那么多数据。”

清华大学计算机科学与技术系长聘副教授黄民烈提到,在GPT-3之后,OpenAI所有的模型都没有开源,但它提供了API调用。在这个过程中,它干了一件事,就是建立起了真实的用户调用和模型迭代之间的飞轮,它非常重视真实世界数据的调用,以及这些数据对模型的迭代。当然,在此过程中,它也养活了美国一大帮创业公司,建立了一个生态。

“你看我们国内的大模型研究,是A公司训练了一个,B公司也训练了一个,打个广告就完了,模型开源,你爱用不用。至少目前还没看到一家比较好的公司,把数据和模型的飞轮完整转起来。所以,我觉得这是我们赶超ChatGPT的难点。”一位业内人士坦言。

除此之外,业界人士都提到了算力问题。由于GPU芯片等问题,在一定程度上,国内算力已被卡脖子了。即使国内头部公司,从算力上跟谷歌等相比,差距也是比较明显的。

从数据质量来说,整个互联网的中文数据质量,相比于英文还是有明显差距。“我们可能要想办法,做中英文不同语言之间的数据互补。”有业内人士称。

此外,几乎所有受访人士都提到了OpenAI这家人工智能组织,所体现的纯碎创新精神和长期主义。“其实从原理和方法看,他们所做的东西业界都是了解的,倒没有说什么是美国做得了、我们做不了的。”云知声董事长梁家恩对数智前线说,但像OpenAI和DeepMind,他们可能是业界唯二的两家机构,无论在创新性、投入、决心,还是在顶尖人才储备上,都是一如既往坚持的。“我们看到的是成功,但里面可能已经有很多失败的尝试。”

有资深AI从业者认为,在看不到前景和没有明显效果的阶段,OpenAI非常坚定地做了投入,相反国内倾向于在技术出现突破后,快速追随。“国内大家第一步想的是,我们现在怎么用起来,但在不能用的时候,人家就在长期投入。”

“这件事其实是值得我们学习的,我们真的需要有足够多的钱,有这么一帮热血的人才,能够在一个方向上这样持续积累发力,我觉得这是一个非常必要的条件。”黄民烈称。

最近一段时间,业界也在讨论中国企业能否超越。容联云AI研究院院长刘杰告诉数智前线,围绕业务,尤其是国内的场景,是有超越机会的。在局部应用中开始超越,这也是业界的共识。

02.对中国人工智能界有何启发

ChatGPT是一种大模型。在它推出之前,国内外实际上已有不少大模型。相比其他大模型,它有了业界意料之外的突破,也给国内业界带来启发。

余承东华为发布会

首先,ChatGPT有一个非常强大的技术底座,也就是InstructGPT模型。但这个模型的论文刚发出来时,没有引起特别大的反响,大家觉得也就是 OpenAI的一篇论文而已。梁家恩也告诉数智前线,此前,GPT与BERT模型路线一直在竞争,2018年时BERT模型先赢了,但GPT模型路线一直没放弃,模型参数和数据规模越做越大,最终结合人工反馈增强学习(RLHF),在ChatGPT上取得了重大突破,效果上反超了BERT模型路线。因此,业内公司正在关注投入更大精力到GPT模型路线上,技术路线交替竞争,在业内是常态。

其次,ChatGPT引入了强化学习机制。容联云刘杰告诉数智前线,ChatGPT不仅仅像以前的大模型,利用了没有人工标注的数据去学习,还在新版本上引入了人工标注的数据,通过人类的反馈,有针对性地进行优化。“这是ChatGPT一个重要的进展,给了我们很大的启发。”

“这是它核心的一点。”华为终端云服务搜索与地图BU总裁赵世奇称,“今天,我们的模型越来越大,它就像一股洪荒之力,有人会害怕未来它会不会控制人类?但引入了这种强化学习机制后,就相当于给洪荒之力一个引导,让大模型的产出朝着可控的方向走,生成符合预期的结果。”比如,你去问它一些伦理安全的敏感话题,它都能答得很好。

这里的难度是建立怎样的强化学习机制。此前,在下围棋的AI中,强化学习是用胜负做反馈。但对于ChatGPT如此开放的系统,是没有明确的反馈机制的。黄民烈称,过去大家也尝试了强化学习机制,但很多都不太成功。ChatGPT在这件事上取得了突破。

第三,它在数据质量和多样性上非常讲究。OpenAI雇佣了一个数十人的数据团队,其实ChatGPT强化学习的数据量并不大,但对数据多样性、标注体系都有精巧的设计,让数据发挥出了强大的作用。业内认为,这确实是值得我们借鉴的地方。

当然,ChatGPT也有明显的不足。大家公认的,是它善于一本正经地胡说八道。刘杰告诉数智前线,ChatGPT是一个黑盒计算,当下在内容的可信性和可控性上有一定局限。“我们要给它足够正确的知识,再引入知识图谱这类知识管理和信息注入技术,还要限定它的数据范围和应用场景,使得它生成的内容更为可靠,这是我们在做的。”

ChatGPT在AI的技术路线和训练方式上的变革,让人关注它对产业带来的改变。特看科技CEO乐乘预计,很多单点环节里,用不用大模型会有天壤之别。没用大模型,只基于自己上一代小模型做产品的企业,跟应用了大模型且还做了业务垂直化的公司,将无法竞争。

多名创业者谈及,这两年创业市场垂头丧气,所有人都在探寻能够大幅度提升生产力的技术是什么。“ChatGPT其实提供了一种新的范式。垂头丧气、青黄不接的状态可能会成为过去。这个领域出几家千亿级别的公司是完全有可能的。”乐乘说。

03.中国企业的动作

ChatGPT推出后,很多人在讲谷歌、百度的焦虑。但大多数中国业内人士认为,目前ChatGPT还是一个对AI技术范式的探索,它并不能代替搜索。ChatGPT当下一个很大的弊端是无法实时获取互联网信息。由于它只是一个端到端的生成模型,能够自我构造虚假答案,这些都是它替代搜索的障碍。而如果以目前每一条几美分的成本来看,它会让商业搜索引擎公司入不敷出。

它作为搜索引擎的补充是有机会的,因为搜索引擎也讲求“所问即所答”,但这还有一个发展过程。

刘杰认为,ChatGPT主要的产业化路径,目前可能性比较大的首先还是在C端。由于ChatGPT展现出的大模型的创造性,以及对长篇上下文的理解能力,它可能会聚焦于一些开放性、创意性和通用性的任务上。

不过,中国企业在行业市场的探索已经开启。比如,在智能客服领域,云蝠智能CEO魏佳星告诉数智前线,上个月他们在一些场景尝试引入ChatGPT来做外呼的Demo测试,调用ChatGPT来回复客户的问题。

“在智能客服领域应用这项技术,核心点在大模型的NLP(自然语言处理)能力和此前企业里已有的NLP之间怎么结合。”魏佳星说。例如帮助顺丰去做回访的快递通知体系,是基于几个标准动作而进行,在这个封闭条件下应该优先企业已有的技术,满足客户当下的核心需求。

在这个需求之外,此前智能客服中的AI工具,在泛化能力和通用性方面存在一定的缺陷,语料信息不充分时,AI没办法对问题做出反应,ChatGPT大模型能够补全这方面的能力。魏佳星反馈,云蝠智能外呼的Demo测试效果较好。在其他行业里这项技术可能仍处于娱乐状态,但在智能客服领域,ChatGPT已具备商用潜力。

从事通讯及数字化服务的上市企业容联云,从2021年围绕着人机智能对话,做核心技术和产品研发,比如智能客服。目前,在研发与ChatGPT类似的人工智能内容生成产品。

但就模型的规模,刘杰有不同的看法。“ChatGPT的优势是它的大带来的,但在应用落地上,由于它过大,也带来了挑战和局限。”他告诉数智前线,“脱离场景去谈大和小是没有意义的。在特定应用场景、特定条件约束下、在特定的数据上,去训练规模适宜的模型,是我们努力的目标。”

小米 双11

刘杰还称,AI是一个链条比较长的产品技术,如果没有建立一个好的反馈机制,在部署运营阶段,从最前线发现的问题,就很难有效定位解决,所以要让模型去持续成长和优化,“它不是静态的,不是交付了就不再管它。”

云知声梁家恩告诉数智前线,他们一直密切跟进业内最前沿的算法,是最早把BERT和GPT2模型方法用到实际业务系统的团队之一,“现在相当于是把基于BERT的技术框架做个升级,目前已纳入云知声今年的技术升级目标规划中。”梁家恩说,ChatGPT的优势是意图理解、上下文对话管理和高质量内容生成,技术升级后,预计会带来显著的体验提升。

与其他企业一样,云知声的目标是先走通,之后在既有的业务比如在IoT智能语音交互对话,以及医疗行业应用中落地。梁家恩也提到了模型的规模问题,考虑商业化成本,实用模型的参数量最终可能要压到10亿量级。

商汤科技数字文娱事业部总经理栾青告诉数智前线,团队更多是利用GPT等生成式内容进行短视频等创作,让大家在创作的过程当中,把生产效率提升,“这是我们的核心点”。同时,商汤已训练了超过300亿量级超大基模型。

出门问问创始人李志飞则告诉数智前线,出门问问从2019年底开始做生成式应用,2020年GPT-3出来后一直在跟踪大模型。目前发力的一个行业应用是写文案。

某游戏人工智能的资深开发者告诉数智前线,这项技术在游戏的用户互动环节和制作环节能看到应用前景。比如用户和NPC(一种角色)互动对话时调用,由于ChatGPT对自然语言的优秀理解能力,用户和NPC互动的开放性能大幅提升。另外在制作环节里,应用ChatGPT,可通过关键词生成故事线,能给策划在剧情走向设计时提供参考。

另外,在数字人领域,特看科技CEO乐乘告诉数智前线,大模型让数字人的内容生产和交互方式发生了变化。

在没有引入大模型之前,数字人说话和行动基本要靠真人行为去驱动。有了大模型之后,内容的输出可以通过大模型来完成。以直播带货为例,数字人公司先给本地生活、知识付费和直播商家等建立一个数字人的虚拟主播形象,而后可以将大模型接入,让大模型辅助撰写数字人直播带货的话术和脚本,“未来在我们关注的泛生活和电商赛道,可能有30%内容能够通过大模型生成来完成。”乐乘说。

04.ChatGPT在行业落地难

不过,业界资深人士提出,当下ChatGPT在行业里要真正落地还面临困难。

“商业模型上跑不通。”魏佳星对数智前线说。ChatGPT目前调用一次的费用在几美分,智能客服一天的问答场景,通常可能要调用几十万次。“我们一通电话收费才1.2毛,利润可能也就2分钱,现在的成本使得它根本跑不起来。“魏佳星认为,当这项产品的调用成本降到1分钱时,行业里可能就会大范围使用起来。

游戏行业的开发者们也坦言,调用ChatGPT的成本和它当下所带来的回报可能并不成正比。几美分只是调用费用,还不算运营费用。“没有一个老板能接受,NPC回复一句话要花掉几毛钱,即使它说得再好。”而用户的游戏体验是个系统工程,文本互动只是其中的一环。当下即使有厂商愿意不顾高成本使用ChatGPT,最终的用户体验也依然可能无法有质的飞跃。

在游戏制作环节,ChatGPT可能也只能作为策划和游戏设计环节的参考,“乍看中规中矩要素齐全,但细品会发现缺少灵魂,在观念性的创造上仍有待提升”。

不过,乐乘对ChatGPT的成本问题相对乐观。OpenAI公司自己也是初创团队,没有那么有钱。随着竞争加剧,大模型会像水电煤一样,是大家都用得起的状态。

刨除成本考量,在对企业的落地中,ChatGPT这类大模型,也有典型的问题。

容联云刘杰举例,首先,很多客户有私有化部署要求,但这些模型非常大,对资源要求高,当前不太可能实现私有化部署。其次,这些大模型在一些特定行业或特定任务上,专业性是欠缺的,需要去适配。而对于ChatGPT这类非开源的大模型应用来说,对它在下游任务上的微调,如何兼顾成本、灵活性和数据隐私则是一个关键问题。这些问题也造成,这种模型还没有走到服务企业级客户,尤其是大型企业客户那一步。

除此之外,现在人工智能技术都在与企业的核心业务流程做深度融合,而像ChatGPT这个基于大模型的应用服务,更像一个独立的外挂,如何深度绑定,这也成为企业使用它的一个待解决问题。

业界人士期望ChatGPT未来在商业模式上有更好的呈现方式。目前ChatGPT对外提供的API还非常单一,影响了应用。

05.创业公司会被ChatGPT吞噬吗

大家在期待OpenAI的下一个版本。GPT-3大模型发布于2020年, ChatGPT则基于它的改进版本创建。此前盛传,GPT-4将于今年一季度或下半年推出,不过OpenAI的首席执行官 Sam Altman在1月份回应,没有具体的时间表。

一些创业者已经开始关注到,随着大模型被越来越多地应用,细分赛道的创业公司在大模型的强大推力加持下,如何寻找自己的生存空间。

它涉及到两点,首先是如何深化对垂直行业的认知,真正把大模型融入到企业的创新业务流中。特看科技乐乘认为,垂直行业的小模型,考验的是创业公司对垂直行业的know-how。创业公司需要基于对行业的认知深度,采集足够多的场景数据,并基于这些细分数据更好服务用户。用户越多,反馈越多,最终形成数据反馈的闭环。

创业公司在小模型的竞争终局比拼的是,谁家的小模型跟业务结合得紧,且能解决好跟大模型结合的问题。

另一点是,大模型被充分使用、喂得很肥后,是否会成为最强大的AI,最终吞噬细分赛道上小创业公司的发展空间。

海外初创公司Jasper的命运颇能反映这种境况。Jasper是一家基于GPT-3大模型来生成营销文案的AI服务商,去年10月它宣布以15亿美元的估值获得1.25亿美元A轮融资。一个月后,基于GPT-3改进版本搭建的ChatGPT大火,智能程度更泛化的ChatGPT彻底盖过了Jasper的风头。

“对创业者而言,在充分利用已有大模型的情况下,也要尽可能要把小模型的闭环数据保护好。”特看科技乐乘说,这也是他们公司未来会重点攻克的方向。

不过,当下底层大模型还在高速迭代阶段,行业内都在等 GPT-4 出来。乐乘认为,从GPT-3到GPT-4的变迁,很像移动互联网早期 iPhone 1和 iPhone4 阶段iOS的升级速度,它的发展速度也许会超出大家的认知。

一些人士猜测, GPT-4将在多模态上有进展,也就是会引入视频、音频等。国内某游戏人工智能的资深开发则告诉数智前线,他们关注的是下一代的大模型能不能在理解上下文上有突破。“如果大模型能让人工智能打赢辩论赛,那么它的能力就算是有质的突破了。”

“短期内可能大家会高估这个东西,但长期可能有很多人会低估这个东西。”这名游戏AI资深开发评价。


返回网站首页

本文评论
东方甄选“薅完羊毛”自立门户,能否摆脱抖音依赖?
文 | 习睿封面来源 | 图虫创意东方甄选又一次吸引了行业的关注,这次是推出独立APP。4个月前便上线的APP,在短时间内下载量达到20万。这被视为东方甄选要摆脱对抖音的依赖,谋求...
日期:09-03
2.5亿年前发生了什么,96%的物种突然消失?中国学者发现重要证据「中国学者发现5亿多年前四不像动物」
灭绝是生命的一部分,动植物无时无刻不在消失,我们星球上曾经存在的所有生物中,大约 99%都已经灭绝。地球正常的灭绝率通常被认为是每100年里10000个物种中就有0.1到1个物种灭绝...
日期:01-11
Apple Watch Series 7被曝过热后爆炸 苹果称将展开调查_apple watch爆屏
IT之家 10 月 8 日消息,据 9to5Mac 报道,一位 Apple Watch Series 7 用户自己的手表在出现过热、冒烟后最终炸裂,目前这个事件已经引起苹果公司的注意,该公司确认将调查该事件。...
日期:10-09
阿里巴巴普惠体第三期发布,新增字体版权检测工具_阿里巴巴普惠体有几种字体
  【ITBEAR科技资讯】8月12日消息,今日,阿里巴巴正式发布了阿里巴巴普惠体第三期,在原有基础上进一步补足语种至178种,同时推出“字体版权检测工具”,帮助用户检查字体是否存在...
日期:08-13
进门就炒了领导层 收购推特后的马斯克要快乐了「马斯克新推特」
美国时间 10 月 26 号下午。嬉皮笑脸的马斯克,抱着一个大水槽,摇摇晃晃走进一座大楼。在他的右侧,是一个巨大的推特标志。毫无疑问,这是推特总部。紧接着,推特停盘,进入私有化。看...
日期:11-04
软银红杉持续加码 这条热门赛道却是“假的”「红杉资本 赛道」
文丨张雪编辑丨张丽娟来源丨投中网“你刷到的网红博主,可能不是真的人。”近日短视频APP上的虚拟人博主受到广泛关注,甚至得到了千万人围观。与我们熟知带货主播不同,这类虚拟...
日期:10-09
苏宁张氏兄弟老二_翻不了身的苏宁 回不去的张氏父子
10月21日,美团闪购宣布与苏宁易购正式达成战略合作,首批175个城市600余家苏宁易购门店已入驻美团。目前,消费者在美团或美团外卖App上搜索“苏宁易购”,即可购买手机、电脑、生...
日期:11-01
特斯拉前三季销量近去年全年:在华“变相降价”抢市_特斯拉前三季度销量
原标题:特斯拉前三季度销量接近去年全年:在华“变相降价”抢市一个简单的app开发时间要多久记者 郑植文 上海报道在成为千万规模车企的路上,特斯拉继续狂奔。10月9日,乘联会数据...
日期:10-13
零跑,靠什么干掉特斯拉?_特斯拉跑的很快吗
文丨庆秋头图来源丨创客贴零跑汽车上市首日股价暴跌200亿元令业界大跌眼镜。零跑汽车在9月底可谓风光无限,先是28日宣布旗下全新旗舰轿车零跑C01正式上市,官方消息称预售订单...
日期:10-12
把警告当耳边风 马斯克被爆强推付费认证导致推特失败_马斯克删推特账号 新闻
凤凰网科技讯 北京时间11月15日消息,据科技新闻网站Platformer报道,就在埃隆·马斯克(Elon Musk)准备推出售价8美元的蓝V付费认证服务Twitter Blue之前,推特内部团队已经警告他...
日期:11-25
阿里和腾讯的互联互通,为何扭扭捏捏?_打通阿里和腾讯
作者丨牧歌编辑丨坚果阿里和腾讯又一次试探性地牵了手,但又似乎没完全牵。10月11日,有认证为阿里巴巴集团的员工在脉脉爆料称,“88VIP积分将可以免费兑换腾讯视频会员,已经在内...
日期:10-15
丰收了!电商助农也“内卷”
贵州黔西南州的一个茶园基地里,茶山层峦叠嶂,空气中弥漫着茶的清香,而负责采摘的茶农正忙得不可开交。“今年大丰收。”茶农朱志益感慨道。而类似的景象,正在华夏大地的各处上演...
日期:10-04
2022年创业公司CEO薪酬报告:不如打工人「创业公司薪酬结构」
“你以为CEO的薪资多吗?是你想多了。”作者 | 王王编辑 | 蔓蔓周首图来源:tnwcdn创业公司的CEO能拿多少薪水?这个问题不光员工关心、VC关心,广大正在创业和想要创业的人也关心。...
日期:12-23
微软 Office 365 世纪互联版已支持 IPv6 和 HTTP / 2
  1 月 30 日消息,据微软官方发布,由世纪互联运营的 Office 365 服务已启用对 IPv6 和 HTTP / 2 的支持,将显著地提升所有客户访问 Office 365 服务的性能,改善用户体验。 ...
日期:02-01
人才流失!2022年 从Meta离职的那些高管们
新智元报道编辑:David【新智元导读】去年,Meta进行了史上最大规模的裁员,实际上,受到这次大寒潮影响的不仅是普通员工,在过去一年里,Meta已经有多位高管重要离开,很多人是核心业务...
日期:01-09
探路3年、解散400名员工,亚马逊无人配送车为何关停?「一名亚马逊公司高管还表示,无人机配送将在5个月内实」
原标题:警钟!亚马逊无人配送车项目关停,探路3年、解散400名员工近期,亚马逊的无人配送车项目Scout突然宣布关停。而仅在4个月前,作为亚马逊无人交付计划中的一个重要明星项目,Scou...
日期:10-19
微软再次警告企业更换Edge:项目继续依赖IE将存在严重风险「ie微软已经放弃」
  近日,微软曾表示将在明年2月永久禁用IE11浏览器。  现在,微软再次警告企业,表示不将项目更换为Edge浏览器,依然依赖IE11的业务可能会面临中断的风险。  在Windows消息中...
日期:12-21
一个辍学少年 让Adobe豪掷200亿美元
作者 | 丸都山“旧金山随处可见的由VC组织的社交活动中,Dylan Field总是独自一人坐在那里,尴尬地自斟自饮。”乐视手机系统还在更新吗根据彭博社记者Brody Ford的描述,仅仅在4...
日期:09-27
奇妙的动物视频_短视频里的“神奇动物” “内卷”到不会“赚钱”
撰文|大可编辑|纪南和主人动手的布偶猫、坐在马桶上上厕所的小香猪、滑板技巧比人还强的斗牛犬、和猫抢饭吃的柯尔鸭……你在内容平台刷到过奇怪的“神奇生物”吗?近两年,随着养...
日期:10-02
关于瑞幸咖啡的新闻的看法_35个月超过瑞幸,这家咖啡有股“韭菜味儿”
今年的咖啡赛道格外热闹,前有老品牌跨界联名,后有新品牌不断诞生。最近,T97咖啡直播间里的大嘴妹靠着喊麦成为带货界新晋红人。比大嘴妹更出圈的是该品牌的老板李潇,他曾扬言T97...
日期:11-14