您的位置:首页 > 互联网

重磅内幕:OpenAI即将开源新模型!开源社区的繁荣,全靠大厂「施舍」?

发布时间:2023-05-16 16:46:56  来源:互联网     背景:

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。

【新智元导读】OpenAI再次开源,是科技大厂的「施舍」还是开源社区的「救赎」?

就在刚刚,根据The Information的最新爆料,OpenAI即将发布一款全新的开源大语言模型。

虽然目前还不清楚,OpenAI是不是打算利用即将开源的模型,来抢占Vicuna或其他开源模型的市场份额。

但几乎可以肯定的是,新模型的能力大概率无法与GPT-4甚至GPT-3.5相竞争。

毕竟,270亿美元的估值也决定了,OpenAI最先进的模型将会被用于商业目的,尽管前两个版本的GPT都是开源的。

对此,OpenAI的发言人没有回应置评请求。

图片

羊驼家族开源大爆发

十天前,谷歌的一份内部文件泄漏。在这篇名为《我们没有护城河,OpenAI也没有》的文章里,作者沉痛控诉了开源对于谷歌和OpenAI的沉重打击。

图片

的确,在这次军备竞赛中,谷歌和OpenAI似乎都不是赢家,因为开源社区正在吃掉属于它们的「利益」。

ChatGPT一出,引爆了全球的LLM革命。然而,OpenAI不Open,很多公司和开发者只能看着干着急。

此时,Meta站出来发布了LLaMA,为全世界开发者谋了一把福利。

本来呢,Meta承诺的是LLaMA会对非商用的研究用例开源,可是谁能想到,仅在发布一周后,LLaMA的权重忽然在4chan上泄漏了,瞬间就引发了数千次下载。

图片

这场「史诗级泄漏」,直接让开源LLM领域变了天。短短几周内,各种ChatGPT平替就以迅雷不及掩耳之势呈爆炸式增长。

Alpaca、Vicuna、Koala、ChatLLaMA 、FreedomGPT、ColossalChat……简直堪称是「羊驼家族」大爆炸。

图片

其实,早在羊驼之前,开源模型就曾破灭过OpenAI的野心。

当时,刚刚发布的Dall-E2凭借着惊艳的文生图效果,在网上引起了不小的轰动。

然而,当OpenAI还在试图兜售API时,一款开源替代突然横空出世——Stable Diffusion。

随着Stable Diffusion的迅速崛起,Dall-E2也很快就被开发者们抛在了脑后。

开源大模型,要颠覆硅谷大厂?

UC Berkeley的计算机教授Ion Stoica正是使用Meta的研究开发Vicuna的学者之一。

为了提高Vicuna的能力,Stoica和同事们正在努力增加模型中的计算数量,这将有助于处理涉及推理的任务,比如写代码。

开发Vicuna的是一个伯克利的团队,每年的预算为数百万美元,其中大约50万美元来自包括微软、谷歌和亚马逊在内的上市公司。

图片

UC Berkeley的计算机教授Ion Stoica表示,现在的免费AI模型,在性能上已经「相当接近」谷歌和OpenAI的专有模型了,毫无疑问,大多数开发者最终都会选择免费模型。

一方面,开源模型可以让开发者使用自己的数据来解决特定的问题。

另一方面,像Vicuna这种模型的训练成本甚至可以低至几百美元,而且还不用向大厂支付昂贵的使用费。

图片

https://lmsys.org/blog/2023-03-30-vicuna/

起亚suv智跑ace

如果Stoica的看法正确,开源AI必将颠覆谷歌、OpenAI、微软等出售专有模型使用权的大厂的商业计划。

Vicuna的质量和开源AI的寒武纪大爆发,让谷歌工程师Luke Sernau警告同事,谷歌在努力追赶OpenAI时,太过关注专有软件了。

如果免费、高质量的平替没有使用限制,谁会去付费使用带有条条框框的谷歌产品呢?开源AI的发展正在超越我们,谷歌应该在开源社区中建立自己的领导地位,并放弃对我们模型的部分控制。

这份备忘录迅速在整个行业内引起了共鸣——即使Sernau或许高估了开源AI的能力,低估了它们的成本和风险,但大多数从业者都同意,Meta非常有可能从中获益。

比如,Meta在内部会使用AI模型进行内容推荐和广告定位,当开发者改进Meta的模型时,Meta就可以把这些改进纳入自己内部的AI。

Meta CEO小扎对此筹谋已久。

4月,在他与分析师的一次电话会议中,他曾这样谈到公司的策略——

如果行业能够在我们使用的基础工具上达成标准化,那么我们就能从其他人的改进中受益,这样会更好。

谷歌倒是没有完全采用专有的方式来处理AI软件。

iphone初代未拆封

早在2020年,谷歌就发布了一个开源语言模型T5,让开发者可以构建能够执行翻译和摘要任务的软件。随后,谷歌又发布了一个更先进的Flan-T5。

image.png

但是,根据Stoica和其他从业者的说法,Meta发布的软件能够在谷歌模型的基础上做出显著改进,这让开发者选择Meta模型的可能性大大增加了。

不过,Stoica表示,谷歌在开源软件方面仍有两个优势。

1. 如果谷歌利用其不向外部开放的用户数据,模型在某些专业领域(如内容推荐)的表现可能会更好。

不过,谷歌发言人表示,公司并没有在现有用户数据上训练其基础模型。

2. 搜索公司在管理大规模计算机基础设施方面的专长,意味着它能够以更低的成本来运行模型,包括为云客户提供服务。

与此同时,OpenAI在收集数百万人与ChatGPT互动方式的数据上,已经抢得了先机,这会更有助于OpenAI改进AI软件,更不用提它和微软的合作协议。

开源的繁荣,是大厂的「施舍」?

不过,这种建立在开源基础上的繁荣,是不稳定的。

目前大多数的开源,仍然依赖于资金雄厚的大公司发布的巨型模型。如果OpenAI和Meta决定关闭业务,繁荣的开源社区,可能就会变得萧条。

图片

比如,现在许多开源平替是基于Meta的LLaMA构建的。

而其他模型使用的是名为Pile的大型公共数据集,由开源非营利组织EleutherAI整理。

EleutherAI之所以存在,是因为OpenAI的开放性意味着一群开发者能够逆向了解GPT-3是如何制作的,然后在空闲时间里创建自己的模型。

图片

但一切都可能改变。

OpenAI已经不再Open,Meta也在考虑限制开源,防止初创公司利用开源代码做坏事。

Meta AI的执行董事Joelle Pineau表示,现在向外部人员开放代码是正确,但他并不确定,在未来五年内Meta还会采用相同的策略。

如果这种Close的趋势继续下去,那么不仅开源社区会被抛弃,下一代的AI突破也会重新回到那些最大、最不差钱的AI实验室手中。

显然,AI大模型的制造和使用方式的未来,正处于一个十字路口。

如果OpenAI曾经吝啬,就不会有如今的开源盛况

其他人也在权衡,这种开源的自由竞争带来的回报更大,还是风险更大。

就在Meta AI发布LLaMA的同时,Hugging Face推出了一个门禁机制,下载平台上的模型之前,用户必须申请访问并获得批准,这是为了限制那些有合法理由的人。

图片

「我并不是一个开源的布道者,」Hugging Face的首席伦理科学家Margaret Mitchell说。「我能看到不开源的意义。」

大模型广泛使用的一个弊端,就是可能造成AI色情产品的泛滥。

Mitchell曾在谷歌工作,并创立了AI道德团队,她对于模型被滥用的风险十分了解。因此,她赞成Meta AI以有控制的方式发布模型。

同时,OpenAI也在关闭水龙头。GPT-4发布时,并没有公布架构(包括模型大小)、硬件、训练计算、数据集构建、训练方法等细节,理由是「鉴于像GPT-4这样的大规模模型的竞争格局和安全影响」。

恒驰汽车4

这种限制反应了OpenAI心态上的变化。联合创始人兼首席科学家Ilya Sutskever表示,OpenAI过去的开放性是一个错误。

OpenAI的政策研究员Sandhini Agarwal说:「以前,如果某样东西是开源的,也许一小群修理工会关心。但现在,整个环境已经改变。开源真的可以加速发展,导致竞争。」

时间倒回三年前,如果OpenAI在公布GPT-3的细节时,就秉持着同样的原则,那就不会有EleutherAI的出现,也就不会有蓬勃的开源创新。

今天,EleutherAI在开源生态系统中发挥着举足轻重的作用。Pile被用来训练多个开源项目,包括Stability AI的StableLM。

但随着GPT-4、5、6被锁死,开源社区可能会再次被落在几家大公司后面。

他们会困在上一代模型中,如果想取得进步,只能闭门造车。

参考资料:

https://www.technologyreview.com/2023/05/12/1072950/open-source-ai-google-openai-eleuther-meta/

https://www.theinformation.com/articles/open-source-ai-is-gaining-on-google-and-chatgpt

oppo总


返回网站首页

本文评论
京东、苏宁、拼多多、小象优品发起一届“新零售”主题618
  今年的618购物节可谓是盛况空前,年中大促的序幕早已拉开,各大电商平台摩拳擦掌,卯足全军之力准备出击。与以往不同的是,今年的618电商节“新零售”形式更加凸显,不仅东道主...
日期:01-24
物流保通保畅:邮政快递揽收量环比增长4.7%(2018年快递业务量增加106.5亿件,比上年增长26.6%)
最新数据显示,8月18日,全国货运物流有序运行,邮政快递揽收量环比增长4.7%。   国务院物流保通保畅工作领导小组办公室监测汇总数据显示,8月18日,国家铁路货运继续保持高位运行,...
日期:08-20
工商局档案曝光 金山CEO傅盛在职私办公司谋利
  最近,360公司在香港起诉了前员工、现任金山网络CEO傅盛,指责其违反了与公司签订的协议。据360公司副总裁石晓虹最新提供的证据显示,傅盛在入职360仅一个月就私自开办有竞...
日期:07-23
2017年9月13日苹果发布会「苹果公司计划于9月7日举行iPhone 14、Apple Watch发布会」
据彭博社记者Mark Gurman报道,苹果公司计划在9月7日(星期三)举行其首次秋季发布会活动。这次活动将重点介绍iPhone 14机型和Apple Watch Series 8。标准版iPhone 14机型预计变...
日期:09-17
Windows 12用户界面抢先看!微软正秘密测试下代桌面操作系统
微软正开发下一代Windows操作系统已经是不言自明的事情,其内部代号为Next Valley。外界倾向于使用Windows 12来指代这套OS,从惯例来讲,也算合情合理。谷歌云游戏现在可以玩吗去...
日期:03-28
金山WPS送上开学办公第一课 请全体教师查收_用wps打开金山文档
  3月1日当天,全国许多省市迎来中小学开学日。这个三月,WPS超级会员将继续为广大师生奉上高效办公技巧及内容,从各类办公技巧到丰富的内容模板,使用WPS的教师用户将拥有一系...
日期:07-16
米哈游《原神》IP营销动作频频,上线两周年后“钱”景几何_米哈游原神周年庆
  蓝鲸TMT 印婧 图片来源:东方IC 小米11pro微曲面屏  近日,米哈游《原神》官宣与动画制作公司ufotable(飞碟社)进行长期合作,与该公司共同制作的《原神》动画项目正式开启。...
日期:10-04
年轻人的台电影机 索尼发布4K Super 35mm电影摄影机FX30:仅1.6万「sony3500 4k摄像机」
9月28日,索尼正式发布了电影摄影机系统新品FX30(型号名:ILME-FX30)。FX30是一款紧凑型4K Super 35mm格式电影摄影机,支持双基础ISO、Log拍摄模式和导入自定义LUT等专业功能,非常适...
日期:10-01
2009年来最惨一幕!显卡真卖不动背后:中国玩家管住手了 价格太贵等
调研机构Jon Peddie Research最新报告显示,2022年第三季度GPU总出货量(包括所有平台和所有类型的GPU)为7550 万,同比下降25.1%。报告中提到,台式机平台出货量下降15.43%,笔记本平...
日期:11-25
特斯拉上海工厂 9 月交付超过 8.3 万辆再创新高「特斯拉上海工厂一期」
10月9日消息:据中证网消息,特斯拉上海超级工厂9月交付超过8.3万辆,再创月度交付记录新高。surface的windows系统怎么样ios13.7 carplay据悉,特斯拉上海超级工厂是特斯拉汽车首...
日期:10-12
将改用USB-C接口 iPhone15 Ultra配置曝光「iphone12 usb type c」
中关村在线消息:近日,根据海外博主曝光的信息,苹果将于明年重构iPhone系列的产品结构,或将推出由iPhone 15、iPhone 15 Plus、iPhone 15 Pro、iPhone 15 Ultra组成的四款全新机...
日期:10-04
阿凡达2票房45亿美金「阿凡达2拿下2022全球票房年冠 网友:它值得」
1月4日 消息:虽然阿凡达2被部分网友吐槽其剧情没有新意,但它的顶级画面依然为其拿下2022单片全球票房的年度冠军(算在2022年上映的电影,包括其映期延续到2022年之后的票房数字)...
日期:01-04
CCTV-6启动影片修复和超清化 约2万部中外电影焕发新生_CCTV6中国电影报道
近日,百度联合电影频道发布业内首个影视行业智感超清大模型电影频道-百度文心,用一个模型同时处理影片修复的多个任务,助力电影频道全方位提升视频修复效率,为用户带来更加清晰...
日期:11-30
雅虎正在为书签网站Delicious寻找新主人
  1月27日消息,雅虎正在为书签网站Delicious寻找新主人。   据Diggnation网站一段视频采访显示,Digg创始人凯文·罗斯说,雅虎曾与Digg协商,看它是否有兴趣接管。雅虎本想赶...
日期:07-26
1366万起!联通9个6靓号上架,钱少勿入_2018联通靓号新规定
中关村在线消息:10月10日,据相关爆料,在国内某网拍平台上,上线了一个联通超级靓号,号码为156666666666,起拍价为1366万,加价幅度为5万一次。该产品一经上架便引发了全场关注,共有6万...
日期:10-27
腾讯音乐二季度财报:营收69.1亿元同比下降13.8%,付费用户数同比增加
查看最新行情   记者/崔鹏   8月16日上午,腾讯音乐娱乐集团(以下简称“腾讯音乐“)公布截至6月30日的2022财年第二季度未经审计财报,其中二季度营收为69...
日期:08-16
马斯克就推特案出庭作证的时间延迟至10月6日至7日「推特马斯克最新消息」
  讯 北京时间9月27日晚间消息,据报道,特斯拉CEO埃隆·马斯克就推特案出庭作证的时间延迟至10月6日至7日。海尔老式手机...
日期:09-28
KS“耐撕大会”:达少从容演讲深情献唱 辛巴现身官方直播间送祝福
  最近快到春节,不少综艺节目真的是有“百花齐放”、“争奇斗艳”的感觉了。前不久就有不少的节目陆续定档了,而最近《吐槽大会》刚播出,又有一个KS小年夜“耐撕大会”来袭...
日期:07-16
比特币价格股票「追随股指 比特币价大跌3.4%下破20000美元大关」
加密货币反映了全球市场的情况,在杰罗姆·鲍威尔警告不要过早放松政策后,比特币跌破了过去两周交易的狭窄区间的底端:20000美元。数字资产基金经理Valkyrie Investments的研究...
日期:09-13
Zoom裁员1300人:创始人放弃奖金 公司市值已蒸发超千亿美元_Zoom员工持股
雷递网 乐天2月8日视频会议应用开发商Zoom Video日前宣布裁员1300名员工,约占全球员工总数的15%。Zoom创始人、CEO袁征日前表示,公司人数在疫情期间增长过快,现在需要调整以适...
日期:02-09