您的位置:首页 > 互联网

Kimi“颠儿了”以后:国产大模型危机感重重

发布时间:2024-04-08 13:54:20  来源:互联网     背景:

声明:本文来自于微信公众号 AI新智能(ID:alpAIworks),作者:竹芒,授权转载发布。

受Kimi影响,百度的文心一言和阿里的通义千问,用户访问量大幅下滑,降幅分别达到33.42%与45.05%。

1

此消彼长

问世以来,Kimi就在不断“吊打”国内各大厂AI模型。

根据券商监测数据,截止3月25日,Kimi的网页端、APP端的用户DAU(Daily Active User,日活跃用户数量)突破历史新高,分别达到了79万和54万。叠加小程序用户量,全端总DAU显著大于225万,或已超越百度(BIDU.O/9888.HK)旗下大模型文心一言的233万。

而半个月之前,3月10日,Kimi的全端DAU刚刚突破120万人。但其实早在2月,Kimi的用户访问量就已达到305万,相较1月超翻倍增长。

与此同时,百度的文心一言和阿里(BABA.N/9988.HK)旗下的通义千问两大TOP2玩家,用户访问量则大幅下滑,降幅分别达到33.42%与45.05%。

数据屡破新高下,Kimi的一举一动也被大厂关注并模仿。

Kimi是月之暗面推出的对话式AI产品。3月18日,月之暗面宣布Kimi支持200万字的无损上下文输入。而在半年之前,去年10月发布时,Kimi可支持的无损上下文输入长度仅为20万字。

因此,大模型的“长文本能力”也受到大厂关注,甚至被认为是大模型竞争的重要性能指标。

3月22日,通义千问升级,向所有人免费开放1000万字的长文档处理功能;360的智脑正式内测500万字长文本处理功能,该功能即将入驻360AI 浏览器。

文心一言也宣布将于4月升级,届时也将开放长文本能力,文字范围预计将在200万-500万。

据笔者了解,不少业内人士却并不看好这些大厂的“东施效颦”。他们认为,Kimi在长文本领域的领先身位,并没有那么容易被超越。

或许正因于此,今年2月,在月之暗面最新一轮融资中,阿里作为领头方,其投资额度的百分之七八十,被置换成算力服务。

苹果7多大屏幕跟十三对比

2

kimi的灵魂

互联网大厂,集中了各领域的技术顶尖人才,但鲜有像Kimi这样的“明星员工”。

月之暗面创始人杨植麟,是Kimi团队的灵魂人物。他拥有清华和卡内基梅隆背景,本人是长文本领域专家。

在过去五年内的自研语言处理(NLP)领域,杨植麟有相当的影响力。在华人学者引用排名中,杨植麟的学术论文位居前10,在40岁以下排名第一。

在读博士期间,杨植麟就以第一作者身份发表 Transformer-XL 和 XLNet 两项工作,在谷歌学术上被引用近两万次,并在多个NLP任务上取得了当时的最佳效果。

Transformer-XL成为首个全面超越 RNN 的注意力语言模型,XLNet则在20项顶级会议中获得最佳论文提名。

杨植麟以及他的团队,创造了Kimi表现优秀的无损压缩技术。这种技术可减少参数对存储的需求、推理的算力,以及数据传输的带宽占用,从而高效率无损处理百万级的长Token。

而为了快速赶上长文本热潮,其他大厂只能退而求其次,选择检索增强生成RAG技术。

Kimi的无损长上下文窗口的方案,是在逐字阅读全文后给出答案。RAG技术是对全文关键信息进行检索生成答案,但可能会丢失掉部分关键的信息。

因此,与前者相比,无论对比输出的深度还是精度,大厂的模型都还存在较大差距。

目前,Kimi并没有公布无损压缩技术细节。除了论文,该技术在学界也没有太多开源内容可参照。大厂想要“学习”、并工程化是非常困难的。

技术之外,Kimi的战略也值得思考。

为快速“跟上形势”,大厂一上手就追求花哨的多模态、导致“样样通样样松”走入平庸。

而Kimi选择“一击必杀”——首先垂直选择打透长文本领域,以培养用户心智,积累用户留存。

自发布以来,Kimi除了将上下窗口从最初的20万字拓展到200万字之外,在指令理解、信息检索能力和模型相应速度上,也持续迭代。

月之暗面内部人士介绍,基于 Infra 层的优化,Kimi生成速度较去年10月份提升了三倍。

2023年12月、今年1月和2月,Kimi用户留存分别为18.48%、22.25%和23.36%。这种高留存的粘性,同时形成了正反馈。

用户们在使用过程中自发“喂”给Kimi很多专业语料。通过不断学习和处理各种类型的语料,Kimi更能理解和适应不同的语境、问题和需求,从而提高其性能和准确性。

在此类专业语料处理上的进步速度,Kimi甚至快于Open AI。

这是因为,目前Open AI对于C端用户上传文件仍然有限制。而对于Kimi用户而言,则是亲手培养了一个高学习力的免费私人助手,持续进行互动

3

加码海外市场

正如马斯克近日发言,升级技术路线的方法,不是与竞争对手比较,那就太简单了。应是不断挑战物理极限。

超越百度等大厂,或许并非Kimi的目标。下一步扩张,月之暗面指向了海外。

目前,月之暗面正在对外招聘国内/国外效果广告设计师。除国内广告平台设计外,这一岗位,还需承担公司产品在海外各大广告平台,如Google,Meta,Tiktok等广告创意设计。

同时,月之暗面也在补足运营短板。

月之暗面技术团队仅有100多人,是头部国产大模型公司中,人数最少的一家。包括安卓工程师、测试、市场、人力等等,都是公司正在招聘的岗位。

以产品增长职位为例,该职位要求有大厂工作经验且擅长通过社交媒体和用户裂变策略推动产品增长,包括拥有从0到1000万用户增长的经验,专注于提升活跃用户数量和长期留存率等职责。

“打不过就加入”。对于Kimi的崛起,阿里虽有自己的通义千问,但也给予了支持。

目前,Kimi借调了阿里的英伟达(NVDA.O)A800以及A100GPU处理器的机型进行扩容,未来Kimi算力侧的支持,也将主要来自于阿里。

今年2月,在月之暗面最新一轮超10亿美元投资中,阿里作为领投方,其投资额度的百分之七八十,将被置换成算力服务器。

有了阿里的支持,Kimi不用再担心因为算力不足而宕机。该人士也表示,扩容并非一步到位。一下子扩容太多,容易造成算力闲置和浪费,需要一定的策略。比如,Kimi也会对用户的使用情况进行预测。

自从2022年11月ChatGPT发布以来,国内AI大模型已超200个,且还在持续增加。Kimi的问世,唤醒了行业巨头的危机意识。

但Kimi也并非这场技术竞赛的终点。

红米k60配置


返回网站首页

本文评论
荣耀X20终于来了,与Magic3一起发布或再成爆款?_荣耀magic3要发布荣耀v40
  7月26日,荣耀俱乐部开启新一期创作者招募计划。有关注该计划的网友发现,作为创作者福利,荣耀俱乐部将提供荣耀Magic3及荣耀X20两款产品抢先体验。根据此前消息,荣耀Magic3...
日期:12-14
nervosa_Nervos & Cryptape 研究员张韧论文被顶级安全会议IEEE S&P接收
  杭州2019年3月5日电-- 近日,Nervos & Cryptape 研究员张韧发表的《Lay Down the Common Metrics: Evaluating Proof-of-Work Consensus Protocols’ Security》被 IEEE...
日期:02-18
腾讯机器狗Max大升级:学真狗惟妙惟肖「腾讯机器狗波士顿」
快科技6月14日消息,腾讯自主研发的多模态四足机器人机器狗Max又升级了。上次是走梅花桩,这次是学真狗。专业术语说就是:将预训练和强化学习技术应用到机器人控制领域。过去一段...
日期:06-14
饲养员用竹竿打熊猫暖暖 园方回应:停职!永不录用!_国宝熊猫暖暖
最近,一个有关大熊猫“暖暖”被饲养员用竹竿催促回家的视频在网上广为传播。根据视频内容可以看到,“暖暖”正在吃竹子,饲养员用竹竿触碰了它的肩膀和头部,导致“暖暖”明显身体...
日期:04-18
作业帮上线“寒假逆袭”指南 清北名师领衔2021高二必备课(作业帮课程资料)
  近日,中国最大的在线教育公司作业帮,面向全国高中学子,特别推出“高中名师大招提分课”,课程涵盖语文、数学、英语、物理、化学、生物六大学科的高频考点,由清北名师领衔传...
日期:01-26
AMD 发布锐龙 7000 系列处理器:16 核 R9 7950X 最高 5.7GHz_锐龙处理器r7 5800
IT之家 8 月 30 日消息,今天,AMD 正式发布了锐龙 7000 系列处理器,包括 R5 7600X 到 R9 7950X 四款。如上图所示,AMD 锐龙 7000 系列处理器首发四款型号的参数如下:R9 7950X: 16C3...
日期:09-28
大模型冰火两重天?GPT访问增速大跌,国内产品热度也下滑,但一天N个发布
声明:本文来自于微信公众号 三言Pro(微信号:sycaijing),作者:雨辰,授权转载发布。当下,大模型、AIGC到底是火还是不火了?让人摸不着头脑。一方面,有国内外的创业公司卖身、ChatGPT...
日期:07-03
AI视野:王小川发布新大模型Baichuan53B;必应免费向用户提供DALL-E3;文心一言将再次升级
小鹏汽车CEO谈特斯拉降价小米全面屏新机图片曝光 采用滑盖形式设计的原因macbook pro 2019款13寸配置...
日期:10-08
解锁都市“有风“生活,创维电视A5D携刘亦菲开启高音画电视新浪潮
4 月 8 日,一年一度的“创维 408 全球电视节”正式开启。作为一场覆盖全渠道、全产品、全场景的电视营销盛宴,多年来创维电视凭借着实力产品、花式营销及超大力度的优惠福利,被...
日期:04-23
科学与艺术的结合,你没见过的CPL微距摄影
  作者:冉冬 [原创]   如果我把这样的图装进画框,挂在墙上,你会不会觉得这是后现代派的油画?或者认为这些流离的彩色花纹是电脑PS出的“特效”?   其实这些色彩背后,是...
日期:10-27
zec算力「面向AIGC类新型计算业务的算力网络挑战与设计」
0  引言2023年是人工智能(Artificial Intelligence,AI)大模型应用元年,多个维度的技术发展推动了人工智能生成内容(Artificial Intelligence Generated Content,AIGC)的产生,其在知...
日期:07-11
不敢住了:承重墙被砸小区有售房意向房主增多_楼房承重墙被砸
最近,黑龙江哈尔滨松北区利民学苑小区B栋装修拆承重墙的话题引起大家热议,因为造成墙体开裂,200多户住户无奈搬离,无家可归”令人心疼。红星新闻在微博分享的后续是,距离4月28日...
日期:05-09
绿源风冷型控制器_随心所“驭”,无惧高温,绿源的风冷控制器实在太硬核了
  “四轮易堵车,双腿又嫌累”。于是,只要距离不是太远,许多人都喜欢骑着“小电驴”穿梭于大街小巷,体验畅通无阻的快乐!不过,电动车骑久了,不少人经常会遇到这种情况:明明仪表盘...
日期:07-17
义乌小商品火遍世界杯:市场份额近70%_义乌小商品为什么成为全国最大的小商品市场
11月14日消息,据央视网财经频道报道,每逢世界杯周期,身为世界超市”的义乌,总不会错过时机。小米11 9008特斯拉 AI DAY据义乌体育用品协会估算,从卡塔尔世界杯32强的旗帜,到大力神...
日期:11-17
哈佛大学下学期将测试使用AI讲师来向学生授课「哈佛大学iq测试」
6月30日 消息:哈佛大学的一门受欢迎的入门级编程课程CS50将于今年秋季由人工智能教师授课。小米civi后摄像头据了解,CS50的教授David Malan表示:“我们的希望是,通过人工智能...
日期:06-30
外交部回应英国禁止华为参加5G建设_德国内政部长:5G建设不应排除华为在外
  1月19日消息 德国联邦内政部长泽霍费尔(Horst Seehofer)在接受《法兰克福汇报》时表示,反对将华为排除在德国5G网络建设之外。   泽霍费尔说:“如果没有华为的参与,我不...
日期:04-16
餐饮配送巨头Deliveroo在伦敦开了一家现实版的杂货店「deliveroo香港外卖」
Deliveroo公司正在消化所有的数据,这家出生于伦敦的曾经的餐厅配送巨头 - 现在是无所不在的商品跑腿供应商正经利用一系列关于购物和膳食计划习惯的调查结果来发展或许业务,跟...
日期:10-06
别犹豫了,品牌种草营销就是现在!_种草营销手段与传统营销区别
声明:本文来自于微信公众号 鸟哥笔记(ID:niaoge8),作者:鸟哥笔记,授权转载发布。“老板说拿预算可以,ROI必须干到3,这样谁敢拿钱做推广啊?”“既要缩减今年的营销预算,还要求曝光量、...
日期:03-29
3C网购老大京东商城腹背受敌:前有当当挑衅 后有“美苏”
  前有当当挑衅 后有“美苏” 夹击今年以来网购商城之间屡屡爆发价格战,此前当当网宣布3C产品全线降价,向京东商城开战,以此“报复”京东此前发起的图书大战。就在京东和当...
日期:07-27
全球网络安全公司排名「AI网络安全公司CalypsoAI获得2300万美元融资」
6月28日 消息:加州人工智能(AI)安全初创公司CalypsoAI今天宣布获得2300万美元的A-1轮融资,以加速其AI治理解决方案的开发。此次融资由Paladin Capital Group领投,Lockheed Marti...
日期:06-28