您的位置:首页 > 互联网

套壳的大模型,为何还活着?_什么是套壳软件

发布时间:2023-11-17 10:36:50  来源:互联网     背景:

声明:本文来自于微信公众号 AI新智能(ID:alpAIworks),作者:AI新智能,授权转载发布。

所谓的“套壳”,并不意味着国产大模型黑暗的前景。

国产大模型套壳,是个被吐槽已久的现象。

最近,前阿里巴巴副总裁、知名AI框架大牛贾扬清昨日发朋友圈,爆锤国内某大厂套壳大模型LLaMA。

大意是:要改就改吧,但别掩耳盗铃了,免得小公司做一些多余的适配工作……

针对这条消息,业内不少人士纷纷猜测,贾扬清所说的那个“套壳大厂”,实际上就是前不久刚发布了Yi-34B大模型的零一万物。

作为李开复AI团队的第一个大模型,Yi-34B有34B个参数,也是基于GPT的架构,且在Hugging Face和C-Eval的两个开源模型排行榜上,都取得了第一的成绩。

然而,在模型发布后不久,Hugging Face社区就给零一万物留了条消息,要求其修改模型张量。

理由是:除了两个张量被重新命名外,Yi完全使用了Llama的架构。

看到这儿,不少业内人士纷纷皱眉:这是赤裸裸的“套壳”吗?

如果是的话,为什么大模型浪潮都已经过去大半年了,这种“歪风邪气”还是层出不穷呢?

1

怎样才算“套壳”?

实际上,在该事件传出后不久,零一万物就做出了回应,他们承认Yi-34B的结构设计是基于GPT的成熟结构,借鉴了LLaMA的公开成果,但是这是为了与行业主流保持一致,更有利于适配和迭代。

不过,这种解释涉及到了个很重要的问题,那就是:到底该怎样泾渭分明地界定“套壳”和“借鉴”?

在开源模型的基础上进行修改、调整,究竟算不算一种“套壳”行为?

从技术层面上来说,判断一个项目是“借鉴”还是“套壳”,关键在于评估所做的改进或优化是否具有实质性和原创性。

在借鉴的过程中,开发者会在原有模型的基础上做出显著的增值,例如引入新的数据处理技术、优化算法性能,或者开发特定于某个行业或应用的功能。

同时,在借鉴时,开发者通常会明确指出,他们的改动是基于哪个开源模型,并说明他们所做的改进和创新。这种做法符合开源社区的原则和精神。

相反,如果改动仅限于表面层面,没有提供任何新的技术见解或实质性的性能改进,则就可以被视为套壳。

那这次零一万物的Yi-34B,算套壳吗?

从已经公布的信息来看,零一万物公司的做法似乎介于“套壳”和“借鉴”之间。

他们确实在一定程度上依赖了LLaMA的架构,但也在数据处理、训练方法等方面进行了自己的工作和创新。

例如,其使用了自建的数据管线,从3PB原始数据中精选到3T token的高质量数据,以及在在网络宽度和深度上测试了不同的Norm方法。

这些改进可能不那么容易从模型的架构或代码直接观察到,它们通常在模型的内部,而不是直接体现在模型的基础架构上。

特斯拉 电动货车

这种情况下,将其完全归类为“套壳”可能有失公允。

但也不能完全视为独立的“借鉴”,原因在于其模型架构与LLaMA架构的高度相似性。

当一个新模型在核心架构上,与现有的开源模型高度相似或几乎一致时,即使在其他方面有所创新和改进,也很难被完全视为独立的“借鉴”。

2

套壳aosp

时间压力

尽管零一万物此次的意外,或许算不上完全的“套壳”,但国产大模型“套壳”的情况,确实由来已久。

国产大模型,为何屡屡“套壳”?

除了算力、人才和资金方面的短缺,让部分团队“另辟蹊径”外,另一个重要的原因,就是当前大模型创业的时间窗口,已经收得越来越紧了。

毕竟,大模型这股热潮,已经燃烧了大半年之久,该入局的玩家早已入局,整个行业的格局已经基本形成。

头部大厂的地位撼动,国外同行又不断推陈出新,留给模型层团队的时间,真的不多了。

在市场上同类大模型越来越多的情况下,客户为什么要偏偏苦守着一个研发缓慢,前途又不甚明朗的大模型?

市场对于快速解决方案的需求迫在眉睫。客户的需求不能等。他们需要现在就能用的解决方案,而不是几年后。

在这样的压力下,部分团队做出了选择:使用开源模型作为基础,对其进行改进和定制,以适应市场的需求。

毕竟,即使拥有顶尖人才,创新和自主研发的过程也是漫长且充满不确定性的。因为人工智能领域正在快速发展和变化,市场和技术的不确定性意味着巨大的研发风险。

在今年10月之前,不少国内团队,都将GPT-4当成“对标”的目标。然而,殊不知你在进,你的对手也在进。

9月底,OpenAI推出了DALL-E3,紧接着又推出了GPT-4V和语音交互功能,在多模态层面更上了一层楼。

而11月初开发者大会的一系列“王炸”更新,则用更长的文本长度、全新的 Assistants API、以及文本转语音(TTS)技术,扼杀了想在“局部领域”进行突围的国产模型。

在技术迭代迅速的情况下,许多团队还在苦苦研发的大模型,也许还没发布,就已经过时。

对于创业团队来说,在保持技术创新的同时,也要考虑到商业模型的可行性和市场的接受度。

而有着成熟框架,且得到市场广泛认可的开源大模型,无疑成了一种可靠的,可以马上投入使用的方案。

并且,成熟的开源框架通常有一个庞大的社区支持,这意味着团队在遇到问题时可以获得更多的帮助。

同时,社区中的其他开发者可能已经解决了一些常见问题,团队可以直接借鉴这些解决方案,避免重复劳动。

3

什么是套壳软件

套壳大模型,能投吗?

在国产大模型“套壳”已经成普遍现象,并且将来极有可能成为常态的情况下,所有投资人都不得不面对一个问题,那就是:

如果硬是要在这些“套壳”的大模型公司里,物色可投资的企业,那应该怎么选?

在考虑这个问题时,有一个非常重要的因素,即:

这些套壳的大模型公司,究竟是完全依赖于“套壳”,没有任何自主研发的努力和计划,还是以“套壳”作为妥协和过渡手段,但有明确的长期发展计划,有创新的愿景,有能力最终转向自主研发?

这两种情况,需要区别对待。

在对这两类企业进行考察时,一个十分重要的衡量标准,就是技术和产品路线图。

因为一个清晰、具有前瞻性的技术和产品路线图,直接反映了企业的长期战略意图和创新能力。它不仅显示了企业是否有计划从“套壳”转向自主研发,还表明了企业未来技术发展的方向和潜在的市场竞争力。

实际上,以类似“套壳”的方式进入市场,最后却依靠自研产品获得用户认可的案例,在商业上并不罕见。

例如移动互联网时代的小米,就是一个明显的例子。

起初,小米的智能手机在外界看来,似乎只是模仿了其他品牌(尤其是苹果)的设计和功能。其早期产品被批评为缺乏创新,更多地依赖于现有的设计和操作系统(基于Android的MIUI系统)。

套壳游戏是什么意思

然而,小米后来展示了对自身技术和产品路线图的长期坚持,其不仅在软件上(MIUI系统)进行了大量的自主创新,还在硬件设计、功能创新以及用户体验上进行了显著的研发。

例如其自主研发的手机芯片Surge S1,就标志着小米在手机核心技术领域的自主创新。

iqoo 无线快充的机型

随着时间的推移,小米凭借更多的创新技术,在市场上获得了极高的评价和广泛的用户基础。

同样地,在当前“套壳”的国产大模型企业中,也不排除存在着一些有着长期技术路线的企业。

倘若以这样的观点来看,所谓的“套壳”,也并不意味着国产大模型黑暗的前景。

从产业的角度来说,只有更多具有创新潜力的企业,从AI浪潮初期的“大过滤器”中幸存了下来,未来更多的自主创新,才可能相继出现。


返回网站首页

本文评论
楼下的超市倒闭了   原因是它不懂什么是“DDoS”攻击
  关于什么是“DDoS”攻击?有这么一个段子。   近日,小卖部老板老王家楼下开了一家无人超市,买好东西只要刷脸支付就可以,目前生意火爆。这么机智又富有高科技的方式,让老...
日期:04-21
中国电信牵头“量子信息未来产业启航行动”_中国电信 量子
通信世界网消息(CWW)9月24日,在合肥市召开的第三届量子产业大会上,“量子信息未来产业启航行动”正式启动。该行动由国务院国资委指导,中国电信牵头组织,13家中央企业和民营企业共...
日期:09-27
联想服务双11,电脑升级与维护,省心好时机!_联想升级计划
10 月 31 日晚 8 点!一年一度的双 11 活动正式开启!在这个特别的购物狂欢季,联想服务为大家带来众多优选好物,联想部件加装升级服务、电脑清洁保养服务、爱机两年全保,以及Lenovo...
日期:10-30
iQOO Neo7 SE首发天玑8200!性能接近骁龙8:2K价位无敌「天玑720 骁龙810」
11月25日消息,今日,iQOO手机官方宣布,iQOO Neo7 SE将全球首发天玑8200处理器,将于12月2日和老大哥iQOO 11系列同台发布。在官宣后,数码博主数码闲聊站”表示,这颗天玑8200处理器安...
日期:11-27
米络星集团刘琼哪里人_米络星集团刘琼为家乡代言,电商直播助力赣南脐橙销售
  疫情防控管制之下,农业生产和销售遭受到了很大的冲击。一边是本地农户、种植基地“卖菜难”,大量生鲜产品积压难卖不出去;一边是市民出门“买菜贵”,日常饮食需要保障!...
日期:07-10
星际巡航换挡手柄罕见!爱驰U6上市:21.99万元
10月13日,爱驰U6正式上市,新车推出2个配置车型,售价均为21.99万元,其中好声音特别版拥有定制装饰并限量销售。车辆定位于纯电中型SUV,续航上,Play版有两种续航,分别为505km和590km(C...
日期:10-15
文旅市场提前“入夏” “五一”出游正升温_文旅最新文件
4月18日消息,随着五一假期的临近,假日旅游的需求日渐高涨。携程数据显示,早在4月初,内地出境游产品整体预订量同比增长已超18倍。机票数据显示,“五一”假期出境机票搜索量同比增...
日期:10-02
怕孩子哭闹父母包下商务车厢 网友看法不一
3月29日,天津。袁女士和丈夫带着6个月大的宝宝回湖南老家,担心宝宝会闹,于是买下商务车厢的所有座位。袁女士称花了11955元,自己也是第一次知道可以包商务车厢。据了解,这对小夫...
日期:03-31
美国半导体行业协会力阻美国政府对华芯片出口限制_美国对华芯片出口限制规定
集微网消息,路透社17日报道,美国半导体行业协会(Semiconductor Industry Association)周一敦促拜登政府避免“进一步”限制对中国的芯片销售。该声明是对(去年)10月出台的一系列限...
日期:09-20
218元自助餐女子5次吃出4万多:店家气到要起诉_吃自助餐收费标准
4月16日消息,据指尖新闻报道,贵州贵阳一店长对记者表示,一顿218元的自助餐,女子月消费5次吃出4万多元总价。店长称,这名女子花了218元下的单,吃的菜品都是一万多,八千多的总价。对...
日期:04-17
Intel处理器被“切割”!无法使用macOS Sonoma部分功能
快科技6月7日消息,在昨天,苹果还只能是公布了搭载M2 Ultra芯片的Mac Pro,正式宣告Mac全产品线不再使用Intel处理器。与此同时,有用户发现,在新的macOS Sonoma系统中,存在部分仅有A...
日期:06-07
首款热插拔键盘CHERRY XTRFY K5V2洪流 耀世登场
机械键盘的奠基者,CHERRY樱桃今日推出与旗下电竞子品牌XTRFY联手打造的CHERRY XTRFY K5V2 洪流机械键盘,键盘支持热插拔,搭载新一代MX2A机械轴体,融合了前所未有的技术创新。CHE...
日期:10-19
苹果设备Windows预览版应用确认其首款头显操作系统名称
1月12日消息:日前苹果在微软应用商店上架了Apple Music、Apple TV和Apple Devices 苹果设备应用的Windows预览版程序,代码显示,其中一个应用程序隐藏了对苹果即将推出的混合现...
日期:01-12
淘菜菜国庆期间上线100万斤自研即食猕猴桃「淘菜菜水果」
9 月 29 日消息,淘菜菜自研的即食猕猴桃近日在全国 200 个城市开售,淘菜菜将在国庆黄金周上线 100 万斤即食猕猴桃。据了解,这款即食猕猴桃是淘菜菜联合阿里巴巴数字农业自主研...
日期:09-30
真我GT Neo5发布会汇总 潮玩电竞旗舰2499元起售_真我GT Neo发布会
2月9日下午2点,真我召开新品发布会,正式发布了GT Neo系列的最新产品真我GT Neo5。作为“潮玩电竞旗舰”,真我GT Neo5起售价为2499元,各方面配置都十分强悍,下面我们来一起看看。...
日期:02-09
9月7日苹果发布会「苹果宣布秋季发布会将于9月7日举行」
  讯 北京时间8月25日凌晨消息,苹果今日宣布,将于太平洋时间9月7日星期三上午10:00(北京时间9月8日凌晨1点)举办一场特别活动。该活动将在加利福尼亚州库比蒂诺Apple Park园区...
日期:09-06
疫情之下,看秦皇岛七中玉龙湾校区网络教学_秦皇岛第七中学玉龙湾校区
  疫情无情,隔空不隔爱。自2020年2月17日起,秦皇岛市第七中学玉龙湾校区中学部正式开启线上网络教学。实施近一个月以来,教学有条不紊,课程完整顺利高效落实,保障了学生的学习...
日期:09-26
超越预期!UU跑腿企业版助力企业降低管理成本30%!人效提升50%!_uu跑腿企业版与个人版区别
 近年来,创业者和中小企业对提升人效的需求日益迫切,因为高效的人效管理是企业成功的关键。在这个关键时刻,UU跑腿企业版作为人效解决方案的领先提供者应运而生,为企业带来了超...
日期:09-21
宝马车的保险「宝马卖保险,到底为了啥?」
  在保险行业“去中介化”的呼声中,近年来有上千家保险中介机构被注销。但在这种情况下,依然有新玩家入场。日前,“宝马也要卖保险”的消息一出,瞬间引起行业关注。其实此前,包...
日期:10-03
别急着升级!火狐浏览器112稳定版出内存泄露Bug「火狐浏览器82.1.3」
快科技4月25日消息,火狐浏览器近日推送了112.0.1版本,但根据官方公告,用户暂时最好不要升级至该版本。根据Mozilla在发行说明中公布的信息,该版本在极少数情况下,动画主题可能会...
日期:04-26