您的位置:首页 > 互联网

王金桥:大模型是万米赛跑,现在才跑了100米_王金桥是哪里人

发布时间:2023-10-22 16:22:52  来源:互联网     背景:

科技《思想大爆炸——对话科学家》栏目第36期,对话中国科学院自动化所“紫东太初”大模型研究中心常务副主任、武汉人工智能研究院院长王金桥。

iphone 市场份额

嘉宾简介:

王金桥,中国科学院自动化所“紫东太初”大模型研究中心常务副主任、武汉人工智能研究院院长,主要从事多模态大模型、视频分析与检索、大规模目标识别等方面的研究,共发表包括IEEE国际权威期刊和顶级会议论文300余篇。

出品 | 科技

作者 | 张雅婷

随着概念热潮的退去,“红得发紫”的大模型产业正逐步进入冷静期,外界也更加关注行业的实际进展与商业化落地情况。

王金桥是哪里人

抖音该商品为平台禁止发布商品

王金桥简介

pixel 6 pro跑分

与年初相比,国产大模型做得怎么样了?与OpenAI的差距变小了吗?烧钱还要烧多久?在2023中国计算机大会(CNCC)正式开幕前,科技与中国科学院自动化所“紫东太初”大模型研究中心常务副主任、武汉人工智能研究院院长王金桥进行了深入对话。

“如果没有足够的GPU,训练不出特别领先的东西”

在大模型产业急速狂飙这大半年来,大模型产品层出不穷。最新数据显示,我国我国有至少130家公司研究大模型产品,其中通用大模型有78家。

王金桥认为,与年初ChatGPT横空出世引发的“恐慌”情绪相比,大家已经有了一定做大模型的经验,现在处于军备竞赛的阶段。

这场竞赛中,算力是核心的竞争力。王金桥认为,如果没有足够的GPU,难以训练出特别领先的东西。

而行业本身对算力的高要求,也导致了厂商面临成本高企的挑战。有报道称OpenAI每天要烧70亿美元,山姆奥特曼前不久还去找中东土豪融资。

据了解,GPT3训练一次的费用是460万美元,模型的参数量越大,训练的成本越高。据说GPT-4是8个2000多亿参数的模型,GPT-5大概是GPT-4的100倍。

并且,降本的拐点仍未显现。王金桥表示,大模型是万米赛跑,现在才跑了100米。现在还处于军备竞赛的阶段,模型越训越好,什么时候好到一个瓶颈现在还没有探索出来。天花板还没有摸到,所以这块的投入肯定是持续的。

“没有钱难以炼出这么大的模型。厂商还得承受失败,可能训练10次才能成功。大模型会比互联网行业更‘寡头’,底座模型不可能像现在那么多。”

在王金桥看来,中国大模型的发展会变成应用牵引,逐渐分很多类别。首先是底座模型,一般参数规模都在千亿以上,有涌现能力、举一反三能力,国内预计未来不会超过3~5家,因为算力的资源是有限的。然后是行业模型,比如面向医疗、教育、安全的行业专用模型,这一块国内发展可能会快一些。

对于最近讨论度比较高的端侧大模型概念,王金桥认为这是一个发展的趋势,因为可以适用于网络不好的情况,也更有利于隐私保护。

目前,厂商都将语音助手作为大模型在端侧的落地场景。在王金桥看来,大模型加持下,Siri不会再像以前那样“智障”。不过像几十亿参数的端侧大模型基本上没有涌现能力,只能做一些固定的问答,遇到脑筋急转弯可能就挂了。

紫东太初多模态能力领先

在上百个大模型中,中科院自动化所旗下的紫东太初算是布局时间较早的大模型之一。据了解,中科院大概是从2019年底开始布局,靠自监督来学习世界知识,而那时候GPT-3还没推出。

关于紫东太初名字的由来,王金桥介绍称这有两方面意义,一个是他们认为紫东太初叫紫气东来、混沌初开,代表着人工智能从专用迈向了通用,从感知智能迈向了认知智能;第二个方面是紫东与自动化所的谐音很像,代表着自动化所自身的意义。

今年6月,中国科学院自动化研究所发布“紫东太初”2.0全模态大模型,在此前语音、图像和文本三模态的基础上,加入了视频、信号、3D点云等模态数据,突破了认知增强的多模态关联等关键技术。

与国内主流大模型不同,紫东太初强调全栈国产化布局,算力主要由华为提供,而非英伟达。“2020年底,华为派了一个团队跟我们联合做攻关,做各种工具链的适配,基本上到2021年我们能把1000亿参数的模型跑通。”

在研发过程中,王金桥认为做大模型最大的困难在于这是一个系统性的工程。“一方面要收集各种各样的数据做清洗,另一方面要整一堆机器训练起来,模型这么大要拆成一块一块放到不同的显卡、不同的机器上。数据的切分,分布式计算,数据的IO.......”

此外,训练过程中还会经常遇到存储坏了、显卡坏了的问题,因为训练大模型几百台机器都要全负荷的运转,比如OpenAI基本上两小时断一次。

王金桥指出,目前紫东太初在语言能力上跟GPT有一定差距,但在多模态方面相对领先。“因为自动化所的团队比较系统,做图像、文本、语音、三维、信号的团队都非常丰富。”

在他看来,做紫东太初大模型的短期目标是把模型能力尽快持续地提升,另外把工具链平台做好,希望让大模型用户不需要太多AI知识就能自己生产模型。

“我们希望能够打造一个国产化的、多模态的底座大模型,来支撑国内各行各业的数字化升级。”

小米5贴吧

第二十届中国计算机大会(CNCC2023)将于2023年10月26-28日在沈阳举行,会议以“发展数字基础设施,支撑数字中国建设”为主题,展望前沿趋势,分享创新成果。本届大会共设19个特邀报告、3场大会论坛,130场技术论坛和丰富的活动及展览展示,ACM、IEEE CS、IPSJ、KIISE等国际合作学会的代表将出席这一盛会,线下参会人员预计达到万人规模。


返回网站首页

本文评论
票房近10亿!《封神》进2023年票房榜前十:投资30亿 导演称若失败10年还债
7月29日,据猫眼专业版数据,电影《封神第一部》票房(含预售)破9.20亿,超《深海》票房成绩,进入2023年票房榜前十。快手电商gmv据报道,《封神》三部曲投资超30亿,想要回本总票房需要高...
日期:07-30
江苏省获评工信部工业互联网安全深度行活动成效突出地区「工信部工业互联网创新发展工程项目」
通信世界网消息(CWW)近日,工业互联网安全深度行活动总结会在湖南长沙召开,会上发布了工业互联网安全深度行活动成效突出地区和典型案例。江苏省获评工业互联网安全深度行“总体...
日期:05-31
1688平台调整数字营销产品相关协议 10月15日生效_1688分销规则
10月8日 消息:今日,1688平台发布公告称,为进一步提高用户体验、保障用户权益,数字营销产品下述协议将做调整,并于2022年10月15日生效。公告显示,《营效宝软件服务协议》、《展效...
日期:10-09
特斯拉上海超级工厂9月份有望生产超过8万辆电动汽车_特斯拉上海超级工厂已经进入试点生产
9月28日消息,据国外媒体报道,在大量生产Model 3和Model Y这两款畅销电动汽车的特斯拉上海超级工厂,年产能已经超过了加州弗里蒙特的工厂,成为了特斯拉旗下产能最高的工厂,二季度...
日期:09-29
苏宁315随时会员首月仅4.9元,更享有优先抢购特权(苏宁九折消费券)
  对于很多人来说,办理会员不仅仅是为了享受价格上的优惠,还有一些隐藏权益如提前抢购、爆款优先抢、商品特供、给予赠品等,给予消费者时间及空间上更多的操作灵活性。   ...
日期:12-05
腾讯控股:耗资约3.52亿港元回购126万股_腾讯投资股份
  腾讯控股9月27日公告,公司于9月27日回购126万股,回购价格为275.4-283港元,共耗资约3.52亿港元。小鹏汽车融资历史估值全民k歌录屏怎么关...
日期:09-30
总奖池超过50万元 知乎启动第三季“长篇创作马拉松”_国内奖金最高的马拉松赛事
【】4月10日消息,据悉,今日知乎第三季“长篇创作马拉松”正式启动。本届比赛聚焦现实题材,分设职业故事、都市情感、青春校园、悬疑脑洞四个创作赛道,总奖池超过50万元。周杰伦...
日期:10-03
4年前吹的牛被马斯克实现了:几乎所有人曾认为是白日做梦(马斯克吹过的8个牛)
  来源:快科技马斯克建立火星城市iphone7plus能双卡双待吗  除了拥有SpaceX、特斯拉等公司,全球首富马斯克还开办了名为Boring的隧道公司,专注于地下挖洞,运输超级“高铁”...
日期:08-23
问界m5什么时候上市「全新问界M7 9月发布!余承东:大沙发更柔软 全车5亿投入下血本」
快科技8月17日消息,华为常务董事、终端BG CEO、智能汽车解决方案BU CEO余承东今日宣布,全新问界M7将于9月发布。meta quest 3 vr 头显细节和设计曝光余承东称,问界新M7大五座无...
日期:08-17
在视频号里看到哪些属于我的机会「我对微信视频号最近动向的一些观察」
声明:本文来自于微信公众号 互联网怪盗团(ID:TMTphantom),作者:怪盗团团长裴培,授权转载发布。我算是视频号最早的一代创作者,2020年3月就开始尝试了;2021年初,我又是最早尝试视频...
日期:06-16
电信借云技术染指“飞信” 云商务时代开幕
  在网络客户端上可以给好友、非好友、陌生号码群发短信,不论信息接收方的号码是移动、联通还是电信。客户端不用安装,在“云端”自动生成,所有的号码也被储存在“云端”。...
日期:07-22
看完5大AI测评,让你一天摸鱼4小时!「看完5大ai测评,让你一天摸鱼4小时是真的吗」
今年上半年AI大模型随着Chatgpt和Midjourney的出圈爆火,迎来了属于它的Iphone时刻,很多学生都开始用AI写论文了。以至于需要用反AI的软件来区别哪个是AI写的论文,哪个是人写的...
日期:08-22
女孩租房开2小时空调用完100元电费引热议:5级能耗惹不起 月薪过万电费也交不起
近日,江苏苏州一女孩租房当天充值了100元电费,开着空调不到2小时发现电费已用完。为什么ipad键盘在中间对于为什么这个快,房东表示,电表坏了这种情况很多,之前也遇到过,给租客换了...
日期:08-05
科大讯飞能成为中国版ChatGPT吗「科大讯飞是中国的吗」
声明:本文来自于微信公众号零态LT(ID:LingTai_LT),作者:张尧,授权转载发布。ChatGPT爆火,中国AI公司坐不住了。据了解,ChatGPT是海外公司OpenAI开发的一种大型预训练语言模型,通过...
日期:02-08
深交所发布对暴风集团及相关当事人谴责处分公告(风暴 送审)
  9月17日消息 针对暴风集团近期相关事件以及暴风集团实际控制人冯鑫被批捕,深交所今天发布关于对暴风集团股份有限公司及相关当事人给予公开谴责处分的公告。   深交所...
日期:01-26
杭州印发网约车新门槛 非新能源纯电动车车价需过15万「杭州新能源网约车要求」
杭州市人民政府办公厅和杭州市交通运输局近日分别发布通知,对网约车的管理细则进行了调整和完善,对网约车的车辆技术标准做出了更高的规定,推动网约车行业车辆升级换代、提高质...
日期:06-26
Redmi发布210W机型 手机充电进入个位数时代_redmi note8充电器参数
中关村在线消息:今日,一则"手机充电进入个位数时代"冲到了热搜第一名,昨晚Redmi发布了搭载210W神仙秒冲技术的Redmi Note 12探索版,最快9分钟就能充满手机电量,210W也是目前地球...
日期:10-29
小米AI识物眼镜获黑客马拉松大赛一等奖 为视障人群提供认路等功能
凤凰网科技讯 8月6日消息,近日,小米举办2023第四届黑客马拉松“创想无界,生生不息”大赛,本次大赛产出了大量创新思维与先进技术相结合的项目成果,经评审,最终“小米AI识物眼镜-基...
日期:08-06
深圳一立体车库禁停比亚迪 车主:赤裸裸歧视_深圳小区立体停车
今天,有比亚迪车主发视频称,深圳坪山一立体车库禁止比亚迪驶入,吐槽这是赤裸裸歧视。字节跳动离职员工期权回购价格摩托车搭老人,死在摩托车车上从视频来看,立体车库门前立牌上...
日期:03-27
老马和小扎,要把40亿人带进Web3
买安卓旗舰机还是买苹果辅导作业的妈妈有多崩溃vivox50poro+传感器信息安全防线   出品|虎嗅科技组   作者|周舟   头图|视觉中国   一个奇怪的国际现象正在互联网行业...
日期:08-16