您的位置:首页 > 互联网

产业版GPT开新路,中国大模型弯道超车的机会来了!

发布时间:2023-05-10 11:22:09  来源:互联网     背景:

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。

GPT系列大模型诞生后,人工智能对话聊天系统就像平地起春雷,在全球爆火。与之同时,国内互联网大厂纷纷「亮剑」。

文心一言、通义千问、商量、序列猴子……大模型的赛道,是彻底被ChatGPT带火了。

chrome版本更新

这场「千模大战」,不仅是让大厂纷纷秀出肌肉,也激活了创投圈,给许多小公司和个人都带来前所未有的创业机遇。

在OpenAI成功「光环」的指引下,国内的企业也纷纷参照起ChatGPT的技术路线,利用RLHF迭代对模型进行优化,甚至直接推出了自己的「ChatGPT」。

但问题来了,作为一种全新的应用形式,「ChatGPT」们又该如何进行商业化呢?

大模型商业化,指向产业

5月3日,Sam Altman在Stripe主持的一次炉边谈话中讨论了OpenAI非比寻常的崛起。

他滔滔不绝地说,「我们花了4年半的时间才推出一款产品。我们正在开发一项技术,但完全不知道我们的客户是谁,也不知道他们将使用它做什么」。

也就是说,OpenAI在商业化落地上,最初是不明确具体路径的。

发展到当下,OpenAI的商业模式主要有三种:针对个人用户的订阅制;与微软深度合作;以及面向企业的API许可。

图片

对于个人用户,除了可以免费使用,OpenAI在2月推出了ChatGPT Plus订阅服务,以每月20美元标准收费。

GPT-4能力接入必应、Office全家桶、自动编码Copliot等等,OpenAI与微软在商业上的合作,想必所有人都并不陌生。

最后一大版块就是,OpenAI面向企业开放的API许可。对于小型初创公司而言,就模型的API,可采用企业订阅的形式,以消耗的token进行计费。

在发布GPT-4后,OpenAI紧接着也开放了最新模型的API,并明码标价。在8K文本中,每1000个请求token是0.03美元,1000个完成响应token为0.06美元。

图片

此外,客户还可以对OpenAI现有的模型进行微调。

但OpenAI会收取相当高的费用,比如,微调Davinci模型的费用为0.12美元,而标准模型的费用为0.02美元。

对于顶尖的大公司,OpenAI推出了一个名为Foundry的服务,这是API服务的扩展,号称「专为运行更大工作负载的尖端客户而设计」。

对于这些客户,OpenAI通常会主动接触,甚至在产品正式发布之前就拿着demo去推销。

比如,摩根士丹利就用数十万份内部市场研究文件,让OpenAI给定制了一个专属的GPT-4以及配套的私有服务器。

虽然没有透露实际的价格,但根据今年2月的一份爆料文件,专用实例的价格最高可达每月156,000美元。也就是DV32K这一标准。

图片

对于先做模型,再想需求这一「破规则」的行为模式,OpenAI总裁兼联合创始人Greg Brockman也对其进行了反思。

他表示,应该创造一个有问题要解决的技术,而不是做出了技术再找解决方案。

我们用了几个月的时间写下所有不同的想法,我们能够通过GPT-3和GPT-4发挥怎样的作用... 或许我们可以在医疗或法律领域做点什么。

在这方面,或许我们从一直在走「产业AI」路线的京东云身上可以找到答案。

更强的千亿级「产业原生」GPT

在国内,ChatGPT引发的大模型混战,像极了20年前的互联网。

彼时,互联网轻资产创业极受追捧。

但京东转身押注了重资产自营模式。庞大的物流基础设施,覆盖全供应链的复杂业务,让京东看起来像一个异类。

但今天,通过将技术等能力渗透进更多节「甘蔗」,京东和产业伙伴的有机组合创新,带来了产业链「成本、效率、体验」的提升。

当下,互联网大厂纷纷进军大模型,比如百度文心一言、阿里通义千问等。

但比起一个「陪唠嗑」的GPT,在产业领域还是更需要一个「专家」。

AI面对的行业、业务场景很多,应用需求也呈现出碎片化、多样化的特点。

我国作为世界上产业链最完备的国家,如果能做出更垂直、更聚焦的GPT产业应用,或许就会抓住弯道超车的机会点,前景无可限量。

然而,产业端做大模型,难度非常高。有的人会说,面对复杂的应用场景,现阶段的AI模型研发就是处于手工作坊式。

对此,新智元认为原因主要包括:面临更加复杂、低频、长尾的应用场景,从开发、调参、优化、迭代到应用,AI定制化程度高;对技术要求高,需要迁移成本低、适用能力强的综合性AI系统。

除此之外,以GPT-4为首的国外大模型,语言性能在英文和中文上也存在很大的鸿沟,在英文语境下的写作表达和理解更好。原因是,OpenAI的训练语料中,90%以上都是英文语料,只有0.1%是中文语料。

因此,在国内的产业应用上,我们就更需要自己的大模型。

近期,国内陆续发布了多款大模型,在此之中我们也听见了不一样的声音「京东宣布年内发布千亿级产业大模型」。

与ChatGPT等面向闲聊式的、通用对话模型相比,京东的优势、GPT的产业前景,就非常鲜明地体现在此次产业版大模型的规划,和其与通用型的方向差异上。

新智元总结,主要是以下三点:

  • 「产业原生」的训练数据集

众所周知,机器学习模型依赖于数据。如果没有高质量的训练数据作为基础,即使是性能再好的算法也会变得毫无用处。

自2019年以来,大多数基于Transformer的通用大语言模型都依赖于来自维基百科、Common Crawl、书籍、期刊等大型公共数据集,以及大量从互联网上抓取到的内容。

图片

利用公开数据训练出的通用大语言模型,虽然掌握的知识范围更广,但在特定领域的文本生成上,则出现专业度、丰富度以及忠实度不足的情况。

而在具体的产业场景上,存在着大量的边缘知识,它们在公共数据集中出现的次数比较少,大模型没有机会进行充分的训练。

想要得到最终能够用于训练的高质量语料,就必须要进行繁琐的「清洗」过程。

图片

来源:源1.0数据预处理流程图

为了改善这些问题,我们可以通过加入更垂直和更丰富的语料来实现。而这些语料,则需要在一个领域有足够长时间的深耕和积累才能得到。

作为供应链优势极为明显的新型实体企业,京东就有着丰富的产业场景和全链数据。

比如,在垂类的零售电商语料上有深度沉淀,并且在制造、金融、物流等领域都有一定的积累。而这些数据会对整个模型,为推理深度带来提升,更好服务产业需求。

基于这些「产业原生」的高质量语料和知识,京东云训练出来的产业通用大模型,更加适合行业使用要求(高可用、高可控、高效果),进而能更快地实现场景落地。

  • 「产业原生」的泛化效果

经过专有数据训练后的模型,有着显著的优势。

举个例子,融入了专业领域知识的十亿级K-PLUG模型对于给定商品的sku,可以自动生成长度不等的商品文案,目前已经覆盖2000多个京东的品类。在商品文案的生成上,K-PLUG明显比ChatGPT的更加符合商家需求。

图片

毕竟,除了要赢得广大消费者的关注外,AI更需要在场景应用中证明自己的价值,特别是在具体的产业场景中,真正实现降本增效等价值。

目前,京东云拥有包括京东智能客服系统、京小智平台商家服务系统、智能金融服务大脑、智能政务热线,言犀智能外呼、言犀数字人等系列产品和解决方案,已经对内服务于超过5.8亿的京东用户和数十万第三方商家,能自动化应答90%的咨询。而商品营销文案生成,直接带来了3亿+的收入。

除了零售,言犀的服务领域也覆盖了金融、物流、政务、交通等多个场景。

图片

言犀的商品文案生成技术取得的成果

  • 「产业原生」的无缝接入

那么,言犀大模型升级后,这些还在用「旧模型」的企业/政务部门该怎么办?

其实,京东云的这部分AI能力是通过言犀人工智能应用平台提供的,当模型能力升级后,已经接入这个平台的企业直接就能用上。

这样做的优势,从基于OpenAI模型的API搭建应用的其他公司身上就能看出。

在OpenAI开放API之后,SnapChat最先推出了基于ChatGPT打造的生成式人工智能对话系统My AI。

然而,My AI在全面向7.5亿用户开放后,却遭到大量网友的吐槽。

因为,SnapChat完全是把这个功能强加给用户,并没有很好了解用户需求去打造聊天机器人。

OpenAI的路线是先做出GPT-3、GPT-4大模型后,针对企业再去做定制模型。这样如果企业想把现有业务接入,就需要重新训练模型权重,或者大改API调用逻辑,会带来高昂的成本。

京东云GPT,本身对于特定产业来讲就是定制的模型,模型升级后,企业针对需求打造的功能,同样得到了升级强化。

产业泛化,指向这轮技术变革的终局

从上面的分析可以看出,与其让AI加应用,不如做产业的AI。

无论是摩根士丹利让OpenAI定制的专属GPT-4及私有服务器,还是专为金融从头构建的500亿参数大语言模型BloombergGPT,都体现了AI产业化的必要性。

京东云早在多年前就提出了产业AI的理念。

何晓冬博士告诉新智元,在他多年的实践中,深刻地体会到:AI必须在真实场景、尤其是产业场景中深度应用、不断打磨,才能创造价值,才能提升自身水平。

现在,AI已迎来iPhone时刻。

那下一步,AI又会走向哪里呢?

图片

何晓冬博士认为,AI的下一步,肯定会走向多模态、走向融合性智能技术。

比如基于京东零售客服的场景,锻炼出的语音、语义、TTS等最核心的能力。在外延后,这种核心技术能力可以解决多个场景的问题。

言犀团队陈蒙博士说,因为京东应用场景比较多,比如最开始去做零售领域的售后环节,不但有几千个商业品类,而且每个店铺卖的东西又不一样,技术团队就需要面临许多模型泛化性的挑战。再从零售领域拓展到政务、金融、交通领域的时候,又会给模型提出更高的泛化性挑战。

2022年,言犀虚拟主播上线,能够定制不同形象,实现了7×24小时无人直播,甚至还能做到直播话术智能撰写、自动营销抽奖活动等等。

据统计,京东云已为4000多家品牌店铺提供代播服务与产品技术支持。例如某头部电脑品牌商使用言犀虚拟主播产品,月度直播间GMV达到千万级,店铺GMV提升28%。

长文本生成也是京东云的突出技术优势之一。就直播文案实时生成上,数字人主播通过长文本生成,能将产品卖点很好的呈现出来。

在直播间,除了对话内容,音色、文案、直播形象均是由AI生成。

对商家和消费而言,直播不仅是商品介绍,更需要在线实时回答用户的问题,与用户深度交互,增加粉丝黏性,提高成交转化。所以,如何判断好的虚拟直播产品?陈蒙说,交互能力是关键。

言犀团队的「任务型智能对话交互关键技术及大规模产业应用」项目,近日也获得了2022年度吴文俊人工智能科学技术奖。

现在京东服务超过5.8亿用户,言犀每日与超过1000万用户进行对话交流,相当于每年都在做十几亿次图灵测试,而每一次测试,都会为AI带来点滴新的进步。

吴友政博士告诉新智元,京东云言犀团队做的很多技术攻关,目标就是解决京东复杂的、真实的、大规模场景中的问题,要求算法同学们都要深入业务,而不是在实验室做模型。所以,2018年产业互联网还没有那么火热的时候,言犀就已经在B端智能领域进行了探索,了解每个业务的痛点,和业务同学梳理出真正的问题是什么,用最终的业务指标去衡量技术先进性。

如此往复,言犀或许就能成为领跑产业版的国产GPT模型。

其实,京东一直在加速技术的产业落地。

何晓冬博士分享了一个案例:去年北京市有2600万通「96010」电话,是借助言犀的人工智能对话技术打出去的。而这些工作,如果没有用AI,需要1万名社区人员不停地打好几个月。

技术成果的规模化应用,产生了重大的经济和社会效益,也是「吴奖」评委们认可的要点。

除了将新一代人机协同技术全面注入政务热线,京东云还携手智云天工,以「智能终端+弹性算力」模式,接入常州区域内近千家工厂的7万多台设备,成功消化了15亿多元的剩余产能。

京东C2M智造平台已与超过两千个品牌达成合作,节省了75%的产品需求调研时间,将新品上市周期缩短了67%。

未来,在智能物流上,京东产业GPT能够帮助物流公司,包括京东物流自身在内,在用户反馈、配送环节等方面实现提升。

在制造领域,通过打造AI专家诊断系统,排除工业中故障,保障客户工程的连续性。

以产业为重点,走向实体。让AI从真实场景中寻找价值、创造价值,致力于凭借独特优势做出「更懂产业的云」,京东云的产业GPT之路值得期待。


返回网站首页

本文评论
推特管理层大洗牌 马斯克需向三名被解雇高管支付逾2亿美元「马斯克发布推特」
10月28日消息,据国外媒体报道,在马斯克27日晚间完成对推特的收购后,一上任就将管理层大洗牌,解雇多名推特原高管。博越pro谍照据知情人士透露,推特原首席执行官帕拉格•阿格拉瓦...
日期:10-28
不要让情人节变成“情人劫” 虚假红包链接要注意
今日是2月14日,即西方传统文化中的情人节,这些年来,我们也逐步接受了它的存在,与520、七夕比肩,成为情侣、夫妻抒发爱意的好时机。微信每年会在这三个日子期间限时开放520元的大...
日期:02-15
理想汽车将于 9 月 30 日举行理想L8发布会「理想新车发布会」
9 月 28 日讯:理想汽车宣布,将于 9 月 30 日15: 00 举行理想L8 发布会。i510200h几核几线程...
日期:09-29
做了那么多年的电子硬件工程师 现在才知道EDA365公益培训活动_微电子eda就业
  有一批这样的工程师,他们从2012年开始,每年都在坚持将自己的工作经验和技术难点免费分享给大家,为大家解决工作上的难点痛点。   截止到目前已举办上百场的公益活动,奔波...
日期:05-18
信也科技 陈磊_信也科技陈磊:集团已形成内外脑结合的研究体系
  11月24日,第二届“全国高校人工智能人才与科技莫干山论坛”(简称莫干山论坛)在浙江德清举办,来自全国的近千位院士专家、高校师生济济一堂,共话人工智能人才与科技的发展...
日期:05-28
苹果手表Series7被曝过热后爆炸 苹果回应称将展开调查「苹果手表换屏幕」
10月9日 消息:据9to5Mac报道,一位 Apple Watch Series7用户反映称自己的手表在出现过热、冒烟后最终炸裂。目前此事件已经引起苹果公司的注意,该公司确认将调查该事件。保时捷...
日期:10-19
当直播间不再卖货_当直播间不再卖货怎么办
声明:本文来自于微信公众号 新声Pro(ID:xinsheng-pro),作者:杨睿琦,授权转载发布。这是一辆正在行驶的汽车,也是卫生巾品牌@高洁丝旗舰店的抖音直播间。暖黄色的星星灯光散落在车...
日期:10-18
卢伟冰红米note11「小米卢伟冰深夜预热新机 Redmi平板和Redmi Note12相继登场」
中关村在线消息:近日,小米卢伟冰连发了两条微博开始预热本月的Redmi新品。卢伟冰口中的这台新机大概率是Redmi Note12系列。苹果ios系统新功能该机在此前已经入网,Redmi Note12...
日期:10-13
暴风迅雷排名之争背后:座次决定上市棋局
  日前,迅雷公布的由艾瑞发布的电脑视频播放器最新数据显示:迅雷看看播放器从八月中旬起每周日均覆盖人数已经超越暴风影音(微博)跃居播放器次席。对此,暴风影音表示,作为播...
日期:07-23
上海电信流量回馈活动_聚焦用户可感、可知、可及!上海电信推出信息消费节十大福利
  5月17日,“世界电信和信息社会日”如约而至,以“数字交响·城市焕新”为主题的2021上海信息消费节也正式拉开帷幕,节日期间,中国电信上海公司(以下简称“上海电信”)响应市...
日期:05-05
peloton自行车官网「美互联网健身平台Peloton将提供翻新自行车:优惠最高达500美元」
  讯 北京时间12月27日早间消息,据报道,当地时间周一,美国互联网健身平台Peloton表示,该公司将在美国大陆和加拿大提供翻新自行车,比新自行车优惠最高可达500美元。  这个名...
日期:12-27
勒索1亿美元,女黑客再次泄露AMD GPU源代码
  3月27日消息 近日有黑客声称获取了包括AMD Navi 21及微软Xbox Series GPU等产品的测试文件源码,要价1亿美元,并威胁如果没有买家就“泄露一切”。   该黑客称,因为源代...
日期:11-01
网易严选三周年打造“严选粉丝节”,致敬每一个用心生活的人_网易严选粉丝专享
  近日,网易旗下自营生活家居品牌,网易严选即将迎来自己三周岁的生日。为了感恩三年里严选用户的支持,此次店庆以“严选粉丝节”为主题,于4月1日至4月11日期间推出“回馈金”...
日期:05-08
涨知识 见大咖 还能进黄埔二期! 百度企业深度学习实战营火热开营
  能够看到逝去偶像的原景重现,是一件开心的事儿。   看,这就是不久之前,AI在4月1日当天带给我们的惊喜! 图片来自网络   亲眼见到已经逝去十六年的张国荣再次“活跃”...
日期:04-07
骁龙730G被全面超越,联发科G90让高通游戏手机计划落空(高通骁龙730g与联发科g90t)
  高性能汽车不仅拥有一个强劲的发动机,其变速箱、制动、悬挂、座椅等同样要强化才能让驾驶者体验到驾驭速度的乐趣,而这个道理同样适用于手机上。过去的普遍做法是提升手...
日期:04-04
盒马上线首批环境友好商品 推出“碳足迹身份证”「盒马环创中心地址」
日前,针对4·22世界地球日,盒马上线首批“环境友好型”商品,包括40余款拥有0碳认证的有机食品,以及30余款拥有碳中和认证和碳足迹认证的环保型商品。vivo s10照相edge睡眠标签页...
日期:04-22
天猫双11第一波今晚8点开买_天猫双十一促销几天
10 月 31 日消息,天猫双 11 第一波将于今晚 8 点开买。多个第三方机构对双 11 商品进行的价格测评结果显示:今年的天猫双 11 商品到手价普遍在5.5-6. 8 折之间。记者从天猫获...
日期:10-31
华为计划投资打造青浦研发中心_华为青浦项目
  (原标题:华为计划投资100亿元打造青浦研发中心,开展物联网等领域的研发)   8月5日消息 据财联社报道,华为公司计划在淀山湖畔西岑社区投资100亿元打造青浦研发中心,将开...
日期:12-02
7000万刘畊宏女孩,在淘宝直播买“周杰伦”
声明:本文来自于微信公众号电商在线(ID:dianshangmj),作者:王崭,授权转载发布。进入刘畊宏的直播间,总是蹦蹦跳跳、碎碎念,一旁的太太vivi偶尔动作划水、瘫坐在地、生无可恋。年近...
日期:11-02
雅虎员工庆祝巴茨下台 支持率仅为33%(雅虎ceo巴茨)
  9月7日消息,据国外媒体报道,雅虎员工们庆祝巴茨的下台,雅虎前高管布拉德•加林豪斯(Brad Garlinghouse)甚至在Twitter上说,“叮咚,巫婆死了”。   有此想法的并非他一人。...
日期:07-22