您的位置:首页 > 互联网

李开复:中国大模型竞争异常激烈,甚至可能超过美国,最终将有几个大赢家

发布时间:2023-12-28 15:42:11  来源:互联网     背景:

12月28日消息,根据风险投资家、谷歌中国前总裁李开复的预测,中国的生成式人工智能创业公司正在经历一场“预选赛”。他今年早些时候创立了零一万物(01.AI),这是一家总部位于北京的初创公司,专注于开发大语言模型(LLM)。上个月,该公司完成了一轮融资,估值高达10亿美元。

中国最大的互联网公司,如阿里巴巴、腾讯、百度和字节跳动等,以及众多初创公司,都在竞相开发自己的大语言模型。有媒体称之为“百模大战”,这些科技公司正为在人工智能领域占据主导地位而展开激烈竞争。李开复在接受采访时表示,这些公司正处于证明其拥有开发高质量模型技术的阶段。而那些通过考验的公司将迈向下一阶段,即如何增加收入并实现盈利。

李开复预测:“在中国,最终将有几家大赢家崭露头角,部分公司可能会体面地退出市场。但大多数企业要么半途而废,要么转向更为实际的目标,如为特定行业构建应用和解决方案”

零一万物成立于今年3月份,目前拥有100多名员工,其中大部分在北京工作。上个月,该公司发布了其首个开源大语言模型Yi-34B,但它未来的收入并不仅依赖于此模型。相反,其商业计划是出售专有的大语言模型,主要面向中国市场。据李开复透露,该公司目前正在开发一种新的、拥有超过1000亿个参数的专有模型。

然而,在Yi-34B迅速登上Hugging Face的开源大语言模型排行榜榜首后,零一万物引发了一些争议。有开发者发现该模型似乎使用了Meta的开源人工智能模型Llama,但并未在相关资料中提及此事。为此,零一万物后来重新命名了Yi-34B的一部分,并公开承认了Llama的贡献。李开复也为他们之前的疏忽公开道歉。

在接受科技媒体The Information的采访时,李开复谈到了零一万物的未来以及中国人工智能产业的趋势。他还谈到了如何应对美国的芯片出口限制,以及中国公司如何在全球范围内寻找商机。

以下为采访全文:

问:中国目前有几十家公司都在竞相开发大语言模型,接下来会发生什么?

李开复:在我看来,这种情况在中国早已屡见不鲜。例如团购风潮、共享单车应用的兴起,甚至在深度科技领域,比如计算机视觉和语音识别技术。当计算机视觉证明其价值时,无数中国企业争先恐后地涌入,试图在各种可能的应用中分一杯羹。然而,大多数企业并未能幸存下来。

如今,中国的人工智能领域仍处于预选赛阶段,竞争异常激烈,甚至可能超过美国。首先,我们需要面对的考验是:在百家争鸣的竞争中,哪家企业能开发出真正具有高质量和高价值的模型?只有技术过硬,模型表现出色,才能在实际应用中脱颖而出。否则,技术只能沦为“玩具”,而不能真正解决问题。

通过预选赛的技术考验后,企业将进入下一阶段:如何增加商业价值?你的商业模式是什么?如何盈利?很快,投资者将提出与云提供商、企业软件公司和消费者应用程序相同的问题。如果企业不能给出明确的答案,那么它们的增长将面临终结。

以美国为例,OpenAI已经证明了其在技术上的领先地位,同时也能够创造收入。这种价值创造使得其他公司愿意为其投入资源,并在此基础上构建应用。

而在中国,最终将有几家大赢家崭露头角,部分公司可能会体面地退出市场。但大多数企业要么半途而废,要么转向更为实际的目标,如为特定行业构建应用和解决方案,而不是单纯地追求大模型的研发。随着时间的推移,研发大模型的成本将会不断攀升。

问:中国人工智能初创公司及其投资者表示,中国将为生成式人工智能模型和应用开发自己的生态系统。你认为呢?

李开复:我们都明白,平行宇宙并不是我们想要看到的。我们更倾向于在全球范围内展开竞争,让真正出色的公司脱颖而出,这样效率才更高。但现实却是,我们无法完全掌控自己的命运。

特别是地缘政治问题。如果我们想进入美国市场,虽然没有规定说我们不能进入,但我不认为我们会得到很多业务。因为在我看来,当前美国市场对中国软件存在一种不公平的偏见。这是我们不得不面对的现实。

当然,我们对全球其他地区的商机持开放态度,但我们深知,有些事情是行不通的。比如,想把我们的专有模型卖给美国公司,这几乎不可能。他们不会买账的,我们也不会做无用功。

中国显然代表着一个巨大的机遇,但我不会将中国公司可能进入的世界其他地区排除在外。总体而言,硅谷的做法是“一刀切”,这种模式在诸如Facebook和谷歌等公司的崛起中起到了关键作用,并帮助美国获得了主导地位。但这次不同了,因为大语言模型是在数据基础上进行训练的。数据涉及到偏见、意识形态和价值观等问题。美国的价值观并非在所有国家都受欢迎,不仅是在中国,甚至有些国家根本无法接受。

我认为中东可能是另一个想要以不同方式思考问题的地区。这促使各国想要更多地对模型进行控制。

我坚信,为不同国家构建具有特殊性的模型是有可能的。硅谷的公司不会这么做,因为他们认为自己的价值观是正确的,并希望更多的人能够接受并融入其中。而且,为不同市场构建不同的大模型需要大量的工程工作,所以硅谷的公司自然不愿意投入这些模型的开发。而来自世界其他地区(包括中国)的公司,可能有机会深入研究这种模型。但显然,他们必须赢得用户和各国政府的信任。

问:有媒体报道称,贵公司成功降低了Yi-34B的人工智能培训成本。你们是如何做到的?

李开复:我们有一支超级强大的基础设施团队,他们可是我们公司最大的队伍。我以前就跟员工们说过,每加一个建模人员,图形处理单元的负担就重一分;但是每加一个基础设施人员,图形处理单元的效率就能提升一些。当然,建模团队也很重要,不过从一开始,我们就特别重视基础设施团队的建设。

关于微博的研究

这些基础设施团队的成员就像是无名英雄一样。他们得负责硬件、软件还有海量的数据传输,得同时处理图形处理单元、内存和网络,这三者中的任何一个都可能成为瓶颈。要知道,图形处理单元扩展到几千以上会很难。从2000个增加到8000个的时候,可不是简单地用软件就能搞定的,因为模型和数据量一大,网络需求就会有天翻地覆的变化。

我们的基础设施团队里有好几十名工程师,是目前零一万物最大的团队。他们得研究怎么用FP8(英伟达H100芯片的数据格式)来大幅减少计算量,这可不是一件容易的事。他们得弄清楚在哪里用FP8,在哪里用其他格式,还得保证它们之间的转换天衣无缝。除了这些,他们还得解决一系列头疼问题,比如应该使用什么网络协议、怎么优化编译器、怎么处理图形处理单元故障等等。实际上,图形处理单元出故障的频率高得吓人。要是一个图形处理单元出现故障,能不能热插拔呢?我们还在努力解决这个问题。想想看:要是在一个拥有上千个图形处理单元的集群里,就因为一个图形处理单元坏了而让你的训练停了一个小时,那要是能热插拔,你每天就能省下一个小时!这些时间可以积少成多。

还有一个相关的话题就是弹性训练。假设你有一个由2000个H100芯片组成的集群,而你只需要500个来执行某个任务,那你能不能在检查点之间把它们移走,然后再加回来呢?这些任务可不是人工智能研究人员该干的,他们更多属于网络工程师的工作。

如果把大语言模型的开发比作火箭科学的话,那就像没有工程师,火箭就永远飞不起来一样。SpaceX的成功可不仅仅是因为它有大量研究人员,还因为它做了大量超级复杂的工程工作。同样地,我们的基础设施团队就是我们的“工程师”,他们的工作让我们的大语言模型能够顺利起飞!

问:美国限制向中国出口先进的半导体技术,包括英伟达的先进芯片。零一万物是如何应对的?

李开复:我曾公开说过,我们的芯片库存足够维持18个月。这些基本上是在限制措施出台前我们获得的芯片。我们肯定在努力研究如何使用中国芯片。但这并不容易,绝不好玩。对它们进行编程不是我们所熟悉的领域。但如果我们必须要这么做,我们也不会退缩。

英伟达有着非常出色的芯片,但有人可能会说,更简单的芯片可以以更低的成本完成这项工作。但英伟达实力背后的一个主要因素是围绕其CUDA软件库的整个生态系统,它使得编程变得更简单。如果你强迫工程师们使用非英伟达的芯片,他们可能会反对,因为这类芯片的效率要低得多。但我们目前面临的困境要到18个月后才会显现,而我们必须更早开始行动。如果我们无法获得英伟达的芯片,我们将寻找更简单的芯片,更专注于转换器,但它们将是一个痛苦的编程过程。可是,如果我们别无选择,那就只能这么做。

但大家都知道,中国工程师有能力、有意愿,而且在处理这种被认为是艰苦的工程挑战方面表现出色。这与我之前所说的基础设施团队的工作类似。学习用非常少的库来编写新的非标准GPU也是一项繁重的工作。

中国企业家是顽强的。中国工程师很勤劳。他们不怕繁重的工作。这正是美团提供卓越服务的原因,也是微信成为卓越产品的原因。的确,我们前面有许多困难的挑战,你可以说它们是浪费时间和很多人的精力。但这是我们手中的牌,所以我们会尽我们最大的努力打好这些牌。(小小)


返回网站首页

本文评论
iPad 2即将上市 配置及性能参数曝光(iPad 2参数)
  1月19日消息,据国外媒体报道,苹果最近几年一直都是媒体的宠儿,关于其产品的传闻也一直 没有断过。所以,虽然iPad刚刚上市没多久,关于iPad 2即将上市的传闻已经不令人新奇了...
日期:07-25
趣链区块链平台「区块链民族品牌趣链科技的7年破局之路」
小米ultra11发布会“跑个步,脚下的步数直接变成数据上链,成为我个人的数据资产,我也成了城市的低碳保卫者!”打开浙江碳普惠平台,我们发现,对普通老百姓而言,晦涩难懂的区块链也已...
日期:05-12
周鸿祎:大家狂吹特斯拉自动驾驶 一旦数据被攻击车就趴窝了「特斯拉的无人驾驶技术」
据新浪科技,在11月9日的2022年世界互联网大会乌镇峰会期间,360董事长周鸿祎与媒体交流时谈到了特斯拉相关话题。周鸿祎认为,未来世界会是数据驱动的。前段时间有争论新能源汽车...
日期:11-20
iPhone销售额_iPhone第一季度:销售量占5% 全球利润占55%
5月18日消息,据国外媒体报道,Asymco分析师贺拉斯•德迪欧(Horace Dediu)17日发布了对包括苹果iPhone在内全球智能手机和手机制造商的数据统计图。第一季度的全球数据显示了苹...
日期:07-28
特斯拉Model3全力生产并大幅降价后发现库存爆满,因为没人买了「2021特斯拉model 3还有降价空间吗?」
多年来,特斯拉的买家不得不等上几周(如果不是几个月的话)才能拿到他们的新电动汽车。现在不行。如果你想要一辆新的Model 3轿车,它可以在一周内停在你的车道上,这要归功于季度...
日期:03-26
苹果手机添加家庭成员id是干嘛的「苹果iOS-17将添加几个用户最需要的功能 Gurman」
据彭博社 Mark Gurman 报道,苹果在开发过程的后期改变了 iOS 17 的策略,增加了几个新的功能,这表明这次更新可能比之前想象的更重要。增强芯片AI能力迎战英伟达,英特尔扩大数据...
日期:10-05
美国芯片跌中国芯片涨「美国芯片巨头股价狂跌 苹果蒸发6106亿」
中关村在线消息:10月7日,道、标、普三大美国股指低开低走,美国芯片股、科技股所在的IT板块遭遇超大跌幅。据悉,芯片股最大跌幅到达14%,而以特斯拉、微软、亚马逊等龙头为首的科技...
日期:10-09
跌停!浪潮信息预计上半年归母净利润同比下降60%~70%_浪潮信息股票
通信世界网消息(CWW)7月12日,自下午开始AI概念持续下挫,算力、CPO方向领跌。其中,浪潮信息今日跌停,据了解,这是浪潮信息今年以来的第三次跌停。截至收盘,报41.20元,成交额87.61亿元,...
日期:07-12
趣链科技:做中国区块链的实干家_趣链科技是什么
第二届全球数字贸易博览会近日落幕,与数字贸易相关话题的关注度却只增不减,多家组织机构与保障媒体陆续发布相关年度评选。在许多榜单中,深耕区块链领域的科技企业——趣链科技...
日期:12-05
华为P60系列发布时间定了 影像大升级「华为p60手机上市时间」
中关村在线消息:今日微博博主曝光了华为P60系列的相关消息,据悉新机将会采用经典的万象双环设计,并且在影像性能方面进行大幅升级,准备升级大底传感器。据悉华为P60系列的发布时...
日期:10-25
oppo find 903「7999 元起,OPPO Find N2 正式发布,仅重 233g」
2022 年 12 月 15 日,在 OPPO 未来科技大会 2022 进展到了第二天,OPPO Find N2 正式亮相,铰链部分采用了超轻固精工拟椎式铰链,高强度复合碳纤维斜板,航天级 MIM 合金材料,较上代...
日期:12-15
直播间明星带货是怎么回事「大批艺人从直播带货中“撤退” 专家称“直播电商进入下半场”」
11月17日消息,据国内多家媒体报道,从2022年开始,刘涛、景甜等火热的明星相继停止直播带货。近年来,乘着互联网快速发展的东风,直播电商以互动性和娱乐性为特点,通过实时视频展示商...
日期:11-17
降价威力巨大!特斯拉一季度交付量暴涨36%_特斯拉一年降价
4月3日消息,在今年1季度实施大降价”之后,特斯拉的销量提振起到了立竿见影的效果,今年第一季度交付量创纪录。数据显示,特斯拉在2023年前三个月交付了422875辆汽车,比上一季度增...
日期:04-03
联想td350服务器感叹号亮黄灯「联想td30t」
联想TD30T是一款性能强劲、功能全面的台式机,适合高要求的用户使用。它搭载英特尔至强E5-2600 v2系列处理器,最高可支持两颗八核处理器,功率最高可达135W。配合着NVIDIA Quadro...
日期:05-29
华为官宣:周杰伦新单曲《圣诞星》上线华为音乐_圣诞夜周杰伦
快科技12月23日消息,在《最伟大的作品》专辑发布一年半之后,周杰伦近日又最新推出了全新单曲《圣诞星》。首发登陆了QQ音乐、咪咕音乐、苹果Apple Music等平台。从以往的上线...
日期:12-23
国内电商发展状况_2011年度全球十佳网商揭晓 体现电商发展三大趋势
  9月9日晚,在历经海选、百佳、三十佳等四轮评选后,备受关注的2011全球十佳网商在杭州第八届全球网商大会上正式揭晓。包括御泥坊、长生鸟、日本Nissen购物网在内的十家网...
日期:07-22
工信部 王志勤「中国信通院王志勤:携手共创新通话产业协同发展」
中国信通院王志勤:携手共创新通话产业协同发展 通信产业网|2023-06-07 14:02:14作者:消息来源:通信产业网2023年6月4日,在第三十一届中国国际信息通信展览会期间,由中国信息通信...
日期:06-07
小米13 Pro发布:第二代骁龙8配一英寸徕卡主摄 售4999元起
凤凰网科技讯(作者/莫环顺 贾楠)12月1日消息,小米于今日举行发布会,发布小米13系列手机,其中小米13Pro搭载第二代骁龙8移动平台,配备一英寸主摄,售价4999元起。外观方面,小米13Pro有...
日期:12-12
暑期调查:“限游令”之下 不少孩子钻漏洞玩网游
三星s6直板恒生指数涨跌一个点多少钱   来源:法治日报   □ 本报记者  赵 丽   □ 本报实习生 赵婧宜   跳伞、降落、伏击、正面交锋……7月30日,暑期一个寻常的下...
日期:08-06
离开中国,黄仁勋头也不回?_黄仁勋lori
作者|普子胥出品|网易科技《态℃》栏目飞机飞过天空,夹克战神黄仁勋结束了中国台湾之行,朝着太平洋另一端离去,头也不回。据6月5日最新消息,英伟达CEO黄仁勋现在已返回美国:在此前...
日期:06-06