您的位置:首页 > 互联网

中国开源大模型们纷纷商用免费,这步走对了_模型开源是啥意思

发布时间:2023-07-18 18:18:19  来源:互联网     背景:

声明:本文来自于微信公众号 未来科技力(ID:smartechworld),作者:王兆洋,授权转载发布。

在中国对生成式模型的监管落地后第二天,在目前最强开源模型LLaMA 再传出即将允许商用,和GPT4的秘方进一步被“泄露”之际,全球开发社区里最受认可的国产开源大模型ChatGLM宣布了一个重要决定:

其最新单卡可运行的模型ChatGLM2-6B,开放给企业用户免费商用了。

开源模型训练平台

红米note七pro跑分

这个消息淹没在Claude2的发布,马斯克xAI的成立等新闻中,缺少讨论。但它其实是中国基础模型开源进程的又一个重要时刻。

7月14日晚间,智谱AI和清华KEG发布公告,称为了更好地支持国产大模型开源生态,经智谱 AI 及清华 KEG 实验室决定,自即日起 ChatGLM-6B 和 ChatGLM2-6B 权重对学术研究完全开放,并且在完成企业登记获得授权后,允许免费商业使用。公告提供了企业登记入口,需要的信息只有姓名,国家,邮箱,机构,用途和要申请的模型(ChatGLM-6B或ChatGLM2-6B)。

据公告,自6月25日发布 ChatGLM2-6B 后,不到一个月这个模型在 Huggingface 上的下载量已经先后超过了120万。

根据智谱AI的官网,GLM2不限实例+不限推理或微调工具包的私有化报价此前是一年30万。而据一名在公告发布前刚刚向智谱问价的开发者称,对方回复可以稍等,“会降价”。

“然后直接免费了。”他说。

但事实上这并不突然。

根据近日报道,Meta 准备发布其人工智能模型 LLaMA 的商用版本。而前不久使用了与原始LLaMA完全相同的预处理步骤和训练超参数的开源模型OpenLLaMA已经率先宣布彻底开源商用。同时,此前曾挖到谷歌那封“没有护城河”内部信的作者,又“揭秘”了GPT-4的工程和训练细节,业内的讨论中有不少从业者倾向于相信它的可靠性。

一切都在剧烈演进,基础模型的飞速进化同时意味着越来越少的秘密:

一方面是大模型本身并没有那么神秘,从最初惊艳所有人的光环中走出后,更多人会意识到这点;同时,几个主要公司之间频繁的技术核心人才流转,最终也会让秘密不剩多少;而更重要的,就是开源社区的惊人能量,众多的聪明才智在基于开源社区对模型进行优化,这种长久的后劲是闭源模型达不到的,而这些能力最终会组合到一起。这几个月开源社区就已经出现了让任何人都可以对LLaMa做指令调优的斯坦福Alpaca,100美元就能训练并看到各类模型汇聚一起的GPT4All,性能堪比LLaMA的阿联酋大模型Falcon,更高质量的数据集Redpajama,以及像OpenLLaMA这类“破解”模型们。

而最近的这次“揭秘”,也是让很多人觉得GPT-4不公开并不是安全考量,而是太容易被学会——MoE模型架构等传言都有一些让人冷静下来的意味。于是看起来一个重要的共识已经在形成,那就是模型们在某一个阶段里取得的任何成绩都无法成为护城河。因此对于那些最受瞩目和最受欢迎的开源基础模型来说,允许商用许可就是必须做的事情,因为这样会更进一步吸引开发者,让这些聪明才智基于它的生态生长。

这也意味着很多基于“LLaMa很难允许商用”,以及“开源模型接近GPT4都是被媒体炒作出来的”短期出发点的分析,长期来看没有必要了。

对于模型提供者,这就需要他们快速调整自己的策略。不仅是开源与否上不要纠结,免费商用甚至也要够快够果断。刚刚把最新的6B版本模型免费商用的智谱就是个典型例子。从最初觊觎已久终于找到机会工程化,做出130B的基座版本模型,到发现6B版本的能力甚至可以做到接近老的千亿模型版本,看到一个可以在自己电脑上安装的模型能吸引的开源社区关注如此之多,智谱其实一直在根据变化调整。

据知情人士称,今年2月智谱就曾想发布自己的模型,这更像OpenAI的路线。但后来各种原因选择开源。而在开源后的表现以及开源社区的进展让团队不少人改变思路。3月14日发布后,3月16日就登上了GitHub的榜单第一,后面连续十多天在HuggingFace的热门榜上排名第一。

据内部人士称,这种迅速获得的认可让团队内部感到十分震撼。

而接近ChatGLM技术负责人唐杰的人称,在开源后他在内部表示,更多的开源是为了让中国的科学家和产业界对大语言模型的训练和运行的机理更加了解,而不是就简单把一个别人的模型拿来微调一下。这是开源的要义。

而未来几个月注定会有越来越多的模型向免费商用进发。

其实只要想明白今天生成式人工智能到底改变了什么也会看得更明白:

今天被大模型强化的人工智能,不是要代替人,而是取代过往那种人与机器的交互。过往基于算力的付费模式本质上都可以理解为建立在对人与机器交互的垄断之上的生意,而大模型就是用所有人都会的自然语言方式打破过去一部分算力精英对人与机器交互的垄断,让所有人都能参与进来。

而开源的逻辑显然更符合这个趋势。

“如果在几个小时内,就能在消费级硬件上微调出一个个性化的语言模型,这件事的意义就太重大了。尤其是,它还可以实时整合许多最新的、多样化的知识。”那篇谷歌内部的《没有护城河》里写到。

一名使用过多个开源大模型进行开发的技术负责人对我说,不是所有人都有必要重新训练模型,但大部分要使用模型的开发者有极强意愿做各种优化方案,而最终它们事实上会是集中在为一个或少数几个开源模型做优化。

于是,当闭源的模型与开源生态注定会越来越多的在解决同样的问题时,闭源用一种大力出奇迹的方式证明路线可能性和天花板之后,开源会真正把它变得易用和可用,在大模型的技术原理越来越没有秘密的趋势下,开源的吸引力会继续变强。而开源社区围绕谁的开源模型进行建设就成了关键,提供免费商用是争夺这个核心角色的关键。

目前国产免费商业授权的基础模型也有了一定数量,其中除了智谱,百川智能使用了1.4万亿token训练的的Baichuan13B模型也是商用免费许可,许多开发者在智谱和百川之间做着对比,而免费商用后,对比的效果会更直接准确有意义。

这些国产模型距离全球顶尖的模型水平仍有不少距离,仔细关注这些团队会知道这些开发团队对此是心知肚明的。而商业可用开源可以让国产模型进一步摆脱只论benchmark评分的阶段,进入了是骡子是马拉出来溜溜的阶段,真正的具体的不同的场景,到底推理表现如何,灾难遗忘的问题如何解决,现实环境数据飞轮启动以后是否能提速追逐,将是每个人都能实实在在看到的。

而最终真的凭此吸引来的生态,才是真正的护城河。


返回网站首页

本文评论
台积电6月营收1564亿元新台币,同比环比均下滑超10%
7月10日消息,台积电于今日公布了2023年6月营收数据:合并计算,2023年6月营收约为1564亿元新台币(IT之家备注:当前约 361.28 亿元人民币),较2023年5月减少11.4%,较2022年6月减少11.1%...
日期:07-11
美军无人航天器X-37B在轨908天后返回地球:6次飞了3774天「美国航天飞机飞太空718天」
北京时间2022年11月12日18时55分,美国太空军旗下的X-37轨道试验飞行器降落在佛罗里达州东海岸的肯尼迪航天中心。这是其第六次执行任务,在轨飞行长达908天,再次打破纪录。X-37B...
日期:11-19
cctv16奥林匹克频道百度百科_央视奥林匹克频道 CCTV-16 正式上线
  10 月 25 日消息,央视新闻宣布,今天 16 时,中央广播电视总台央视奥林匹克频道(CCTV-16)及其数字平台正式开播上线,这是国际上首个以 4K 超高清和高清标准 24 小时上星同步...
日期:07-14
分析师表示明年苹果iPhone 5G手机销量可能令人失望_现在买苹果手机划算吗5G到来了
  12月14日消息 Loup Ventures的执行合伙人Gene Munster表示,受美国5G网络覆盖范围等因素,明年苹果iPhone 5G手机销量可能令人失望。   当涉及到新一代网络这一领域,苹果...
日期:09-12
诺基亚6650s「诺基亚神秘新机曝光:骁龙 695 处理器   4800mAh 电池」
据GIZMOCHINA报道,诺基亚即将推出一款名为“诺基亚XR30”的手机。但在发布前,该机已更名为“诺基亚XR21”,并曝光了部分配置信息。这款手机将配备一块6.49英寸的IPS液晶显示屏,...
日期:05-02
特斯拉因石子故障维修需花14万 车主表示无法接受_特斯拉撞坏了去哪修
据新车场报道,南昌董女士开着特斯拉出门时,因为碾过路面的小石子,导致石子弹飞到车辆空气管上造成故障。她在行驶中发现行驶灯不亮了,并且无法提速。OPPO天玑2000rtx显卡上市时...
日期:03-08
女子投简历被告知不招豫籍 直呼地域歧视很不公平:网友力挺河南人
1月27日,上海。有网友发视频称,她在网站投简历应聘,被对方告知不招豫籍。当事人表示,该公司在网上对职位的具体信息没有介绍,她询问时被告知不招豫籍,她认为这样的做法是地域歧视,...
日期:01-28
传工信部已经介入 金山360口水战暂停
  上周末金山爆出“360泄露用户隐私”一事,昨天又有新进展。此前一直处于被动的360公司,昨日反指金山“搜集用户隐私”。360称,使用百度、谷歌、搜狗、必应等搜索引擎,均可搜...
日期:07-25
继续爆投资圈残酷内幕:给钱之前要不要先算命?
声明:本文来自于微信公众号 铅笔道(ID:pencilnews),作者:铅笔道编辑部,授权转载发布。昨天,铅笔道发布文章曝一个投资圈恶毒真相:罗永浩也没能躲过,在创投圈被火热转发。不少创业...
日期:01-10
孙正义继续收缩:软银愿景基金开启裁员,比例或高达30%「软银孙正义股份」
  记者 戚夜云  造成软银集团巨亏的愿景基金,已开启大规模裁员。  援引彭博社消息,周四开始,软银愿景基金员工陆续将接收到裁员通知,知情人士称,此次裁员比例至少30%。  ...
日期:10-05
成都富士康限电停产一周(富士康停电停产)
财联社8月15日电,财联社记者从负责富士康招聘的中介处了解到,成都富士康从15日至20日限电,仅保留20%保安负载,全厂生产停止。生产线员工对财联社记者表示,已接到休息通知。(财联社...
日期:08-18
《王者荣耀》七周年庆新活动上线:今日登陆免费送史诗级皮肤「王者荣耀六周年送皮肤活动」
最近几天,《王者荣耀》手游迎来了7周岁的生日,官方也举办了一场七周年庆活动,给玩家们带来了丰富的福利。根据官微消息,《王者荣耀》游戏内今天正式开启两场新活动:【很高兴遇见...
日期:10-31
腾讯投资《死亡链接》开发商Gruby Entertainment,成后者少数股东
  IT之家 10 月 5 日消息,当地时间 10 月 4 日,波兰独立游戏开发工作室 Gruby Entertainment 宣布,腾讯控股有限公司已同意收购该公司少数股权。  IT之家了解到,Gruby 首席...
日期:10-05
试戴金戒指动了活扣需要赔钱吗「女子试戴金戒指断两半遭索赔 网友:什么黄金这么脆」
2月20日,广州,有网友陈女士报料称,她去购买金饰,试戴金戒指时发生了断裂。店员提出两种赔偿方案:一是按戒指2235元原价的30%赔偿,二是按以旧换新的标准购买其他款式。小米11pro可...
日期:03-01
360提示:知名iPhone论坛威锋网遭大面积挂马
  6月3日消息,今日有iPhone手机爱好者反馈称,自己在访问iPhone、iPad主题论坛威锋网时发现360提示拦截木马。经360安全中心验证,由于威锋网的广告中内嵌了一个木马页面,导致...
日期:07-28
魔兽世界哪里充值优惠大「要再见了!《魔兽世界》临时充值渠道将于1月1日0点正式关闭」
暴雪与网易的合作协议将于2023年1月正式到期,届时将关闭所有国服游戏、客户端、账号。除了《暗黑破坏神:不朽》之外,《魔兽世界》《炉石传说》《守望先锋》《暗黑破坏神III》《...
日期:12-31
谁还在抢着做「旅游」这门苦生意?「干旅游挣钱吗」
声明:本文来自于微信公众号 真探AlphaSeeker(ID:deep_insights),作者:李静林,授权转载发布。旅游生意不好干已不是什么新闻。根据文旅局发布的数据,2022年上半年国内旅游总人次为...
日期:10-01
美国电影夺宝奇兵「《夺宝奇兵5》哈里森·福特使用AI分身年轻了40岁」
声明:本文来自于微信公众号 摩登AI(ID:modernai),作者:三石,授权转载发布。你有没有想过,当你在电影院看一部电影时,影片中的明星可能不是真人,而是他们的AI分身?虚拟AI的帷幕已经拉开...
日期:06-09
法拉第未来上市贾跃亭身价「贾跃亭真成了 法拉第未来宣布:FF 91将于3月30日开始生产」
今晚,拉第未来宣布启动FF 91 Futurist开始生产倒计时,该车型将于美国时间2023年3月29日(北京时间3月30日)开始生产(SOP)。公司将于美国时间2023年3月29日在其FF ieFactory Califor...
日期:03-24
疫后终端门店“复活”,该如何“增效降本”?
  一场突如其来的疫情,随着国家采取乡村封路、社区封闭、终端关门、消费者居家自我隔离等措施,全国按下了暂停键......   然而,资本面前无疫情。这对绝大多数线下门店无...
日期:07-14