您的位置:首页 > 互联网

专家访谈,看4月大模型混战,华为阿里商汤都走到哪了?_华为商业模型

发布时间:2023-04-10 15:24:12  来源:互联网     背景:

声明:本文来自于微信公众号 奇偶派(ID:jioupai),作者 |叶子 编辑 |钊,授权转载发布。

3月下旬,英伟达在美国加州总部举办了面向软件开发者的年度技术峰会GTC。会上,创始人黄仁勋发布了专用于大语言模型部署的GPU推理平台——H100NVL, 其或将在推理阶段实现比现有最先进的A100快10倍的速度。

但如此先进的GPU却无法运往国内,去年8月,美国监管机构以国家安全为由,对NVIDIA A100、H100两款GPU实施禁令,不得销售给国内企业,意在通过“卡脖子”的方法来降低国内AI模型的传输速度,拖延中国人工智能发展。

而目前也确实对国内AI企业产生了较大的影响,在算力的大需求之下,呈现出了“一卡难求”的情况,就连阉割版的A800也一直处于缺货的状态。

但与GPU硬件窘迫的境况不同的是,在继3月16日百度发布文心一言大模型后,国内众多科技、AI巨头都相继公布了各家大模型的发布会时间:4月8日华为盘古大模型发布、4月10日商汤大模型发布、4月11日阿里大模型发布、4月14日同花顺举办AI产品发布会,国内大模型的“百家争鸣”与GPU被禁运后的“惨淡”状况,也形成了鲜明的对比。

电子邮件钓鱼攻击

这个4月,成为国产大模型混战期。

那么,在GPU受限的情况下,国内AI行业发展境况如何,能否交出属于他们自己的答卷?未来的发展是否会与国外越差越大?

本文,奇偶派以已经发布或近期即将发布的大模型与相关AI应用的企业为例,通过专家访谈等方式,研究和分析各企业AI大模型的发展状况。

1

华为盘古大模型避开GPT

剑走偏锋?

华为盘古大模型,最近的发布多少有点高开低走,突破性进展不多,尤其是在C端几乎没有新应用侧产品,主要还是展示了华为在B端智能化方向上的技术实力,为华为云服务和可见的销售市场做技术支撑。

4月8日,在人工智能大模型技术高峰论坛上,华为云人工智能领域首席科学家田奇介绍了盘古大模型的进展及其应用状况,包括NLP(自然语言处理)大模型、CV(机器视觉)大模型、科学计算大模型、多模态大模型、语音大模型等的研发与应用的相关情况。

小米路由器运营商

华为商业模型

在会前,最引人关注的莫过于盘古的NLP大型模型,据介绍,该模型利用了深度学习与自然语言处理技术,并且采用海量中文语料库对其进行培训。

而在参数和数据的堆量方面,百度文心一言参数为100亿,数据为4TB。而GPT-4则达到了1750亿,数据45TB。华为盘古大模型的参数高达1000亿,数据高达40TB。如果单从参数上看,盘古大模型已接近GPT-3.5。

但在这次发布会中,田奇却并没有提到盘古NLP大模型的相关应用。只是将过去已经发布的功能,进行了较为简单的集合介绍。相对而言,另外两个大模型则着墨更多,以较多篇幅介绍了CV大模型和科学计算大模型的应用范例。这也让众多翘首期盼华为能发布一款赶上ChatGPT应用的“粉丝”们,多少有一些失望。

但实际上,早在发布会之前的相关交流中,内部专家就已经就该话题做出了相关回答:

“首先,在华为发展历史上,很少是在新的趋势出现后立马就追上来的。公司发展的30多年间,基本没有做到过先发,而是一直采用后发制人的打法,在手机、在云、在汽车上是如此,在这个领域中也会如此。”

“想要做出一个比较完美的NLP大模型,是一个集团级的项目, 通常做出决定会比较缓慢,在一两年内也不太会出现。而当前公司在尽力地完成AI工程化、AI产品化,公司认为这是商业化不得不走的路线,如果采用高度项目制,成本很高,并且也会出现项目不可复制的情况,因此华为的重点最后才放在了面向行业的CV大模型上。”

正如相关专家所说的,盘古大模型中最为领先的,正是CV(机器视觉)大模型。

会上,田奇还谈到,在过去的2022年,华为盘古大模型主要是AI for Industry(AI赋能产业),为煤矿、水泥、电力、金融、农业等行业创造了更多产业价值,其中CV大模型早就有了许多用武之地。

比如在与能源公司合作的盘古矿山大模型中案例中,矿井现场是一个40米长的采掘机,宽度仅2米左右,传统相机很难一下子捕捉到全部画面,只能用图中的九宫格视频画面。而通过5G+AI全景视频拼接综采画面卷,传输到地面,地面工作人员将来可以实现地面控制机器进行采矿,实现矿下无人少人安全作业。

盘古矿山大模型还用在了煤矿的主运输皮带作业监控。煤矿被采集下来以后,它会通过一个主运输皮带,从地下传输到地上。按传统方法是通过工人配合作业,华为提出通过视频对作业的安全规范进行巡检,主运场景的异物识别精度达98%,煤矿作业场景动作识别准确率达95%,助井下安全事故减少90%以上。这些都是CV大模型的落地应用。

此外,大模型还能进行轨道机车缺陷检测,比如掉链、脱落、裂痕等潜在不安全因素,人工检测成本较高,盘古大模型提供图像质量的自动评估、小样本的故障定位与识别等。

华为商业模型

可以说,华为选择了一条与其他AI企业不一样的道路——暂时放弃以ChatGPT为代表的C端需求,专注B端工业需求的开发。

不可否认,华为作为国内受美国制裁最严厉的公司,无论从算力资源、或是从公司发展理念、又或者是从商业化角度来看,选择专精于B端的打法是正确的。一来可以避免超大数据量的训练,二来又可以为处于“寒冬”中的集团早日“造血”。

或许,在算力无法获取之时,不去纠结内耗于ChatGPT,才是华为真正的AI之路。

2

手握巨大算力的

商汤大模型,未来有隐忧

紧接着华为盘古大模型发布后,商汤科技的大模型也即将登场。

不过,由于上市公司相关信披原因,目前公司正处于发布大模型之前的静默期,所以没有办法披露过多的大模型相关内容。但是,作为最早把人工智能大模型写入招股说明书的公司,商汤确实是有着足够的实力,来推出独属的大模型。

而在近期的相关交流中,商汤相关人士还是回答了一些与算力相关的问题。

首先是大众最关注的算力资源方面,商汤拥有极为充足的GPU储备,对方表示,在去年停售之前就有1万张A100芯片了,完全可以覆盖训练一个千亿参数量的语言模型的消耗。

而除了英伟达专用显卡外,商汤也有采购国内的GPU,专家表示:“比如说寒武纪与海光,最近这两家公司可能很多投资人都很关注,想了解他们的产品是否进入了大规模试用阶段。但是,如果大家在去年有去参观我们商汤的大装置的话,就应该看得到我们在大装置里面已经适配了很多寒武纪和海光的GPU卡,我们也是寒武纪最大的客户之一”。

而在谈及国产替代方面时,专家也坦言,“我们很早就开始与国产GPU厂商合作,去适配国产GPU卡,但坦白来说,当前的大模型训练,确实是只有A100与A800能够胜任,国内GPU卡的易用性与性价比都无法去比较,但在推理阶段,寒武纪最新款的GPU在大模型领域也有了不错的表现,期待未来会更好。”

而在被问及H100出现是否会对国内AI企业产生影响时,专家表示,H100加速芯片的出现,确实在性价比上有十分显著的提高。但如果不考虑性价比的话,当前已有的芯片是完全可以胜任的。

而在算力的使用技术方面,商汤较众多AI企业来说有着极为明显的优势。

在A100存量优先的情况下,如何利用仅有的资源去做更多的事情,成为了商汤需要解决的一大问题。

专家表示,商汤科技在过去五年中,有着丰富的千卡并行的训练经验,最大的单任务训练可以同时调动4000张A100的GPU卡,等效算力为1万张A100,已经达到了训练GPT3甚至GPT4的门槛。

而在国产GPU的优化适配上,商汤也同样有丰富的经验,“目前有10%左右的算力,是由国产GPU卡提供了,商汤也一直在进行适配,无论是规模比较大的寒武纪、海光,或是当前规模比较小的昇腾,都有着相应的适配支持”。

也正是因为多年的训练经验,让商汤获得了较为明显的优势,“我们目前的算力规模可以支持20个千亿参数量超大模型共同计算,同时训练,对客户的技术迭代有十分明显的帮助。”

但被问及当下的挑战之时,专家再次重点提到了国产GPU的适配问题。即当前国产GPU不太能够支持超大模型的训练,还需要投入更多去进行优化。此外,虽然国产GPU已经展现了一定的能力,但依然任重道远。

总的来说,商汤科技作为最早一批的AI企业,有着极为深厚的训练经验,也在禁运之前拿到了上万张A100显卡,这让其在当前的AI大战中拥有了极强的竞争力。

但从另外一个角度来看,短期内高端GPU禁运的影响还可以通过丰富的训练经验、更大的成本投入来进行掩盖,但从长期来看,如何能持续获得高端GPU,才是商汤需要考虑的问题。如果禁运依旧存在,并且国产GPU无法适配超大模型的训练,那么与国际尖端AI企业、与最先进的大模型之间的距离,将会被持续拉开。

3

阿里大模型突上线

华为手机新款mate50

全面发育还是落后?

华为商业模型

4月4日,B站一则阿里版ChatGPT全网首测视频流出,引爆全网,同日下午,阿里正式宣布将于4月11日的阿里云峰会上推出大模型。

从视频中看,阿里大模型超出大家预期的主要有两点:

一是“音色”“文风”“情绪”都可改变,定制化属性显现,受众面大幅增加,视频中UP主先是运用了脱口秀演员“鸟鸟”的声音作为模型交流,然后并要求ChatGPT接下来用“猫娘”的身份进行后续对话, 整体定制化特征明确,不再局限于固定形式,代表着后续每个人可根据自己的需求定制属于自己的“性格”不同的ChatGPT,几乎可满足所有受众群体。

二是阿里GPT的成熟程度超出预期,15个问题中有10个问题的回答都明显好于国内已经公布的竞品,并且突破了双工对话,整体带入性更强。

而就在发布前的一周,也有相关内部专家接受了采访,回答了“国内语言大模型与ChatGPT有多大差距”的相关问题。

专家表示,起码在未来的一年到一年半之间,国内是绝不可能出现对标GPT4的产品的,只有先把ChatGPT(GPT-3.5)追上,才有资格去谈GPT4。目前,国内大多仍然都是以文本、图像、视频等单模态的方式发布的,并且文本大模型已经进入商用阶段,百度走出了第一步,其他的众多AI企业和科技企业也都会在年中或者下半年进行发布。

而在追赶GPT-3.5的过程中,也有着三个核心瓶颈:

一是数据量的不足,只有拥有了足够多的数据,才能继续训练,而公有的数据大家都可以买到,所以核心竞争点是如何获得足够多的私有数据,权重占比达到了三成左右。

二是模型结构的创新性,国内的语言大模型目前做不成高层级的架构,也就没办法做海量的数据训练,也是最大的瓶颈,权重达到了四成左右。

第三便是工程化的能力,在工程落地的时候,大家都知道需要预训练、调优训练与推理训练,但在真正部署的时候,是完全要靠自身去摸索的,包括数据的处理,模型的训练,模型优化,模型的部署和运用,都需要投入大量的时间、精力与财力,这方面的权重与数据量类似,也是达到了三成的权重。

但这一切的前提是算力充足,阿里是当前国内拥有A100GPU最多的企业,在当下阶段算力并没有多大阻碍,但未来伴随着禁运的持续与算力需求的增加,也将面临高端运算卡不足的情况。

而在追赶ChatGPT之外,电商作为阿里起家的领域,也让人好奇阿里大模型将会为电商领域带来多大的改变。

专家表示,在电商场景中,比较主要的还是推荐算法与营销图案、文本的生成。未来,阿里大模型将会包揽营销图案、产品介绍、产品描述等工作。

“实际上,去年我们就已经让一些商家使用这个技术了,我们挑选了上百个商家,预计要花数百万去请广告公司去做的营销图案,阿里大模型的AI都可以胜任,cover40%的工作量。”

“而在营销之外,还有虚拟直播等许多场景可以被替代,包括仓储预测、物流信息的挖掘,都需要一步步找场景渗透,慢慢将老一代的技术进行替代,帮助中小企业,最终达到双赢”。

总的来说,阿里大模型作为一个庞大集团下的一条项目线,看起来并不像其他AI科技企业那么出彩。但目前,阿里的文本大模型进度在国内也已经位属前列,并且其他模型也在有序推进之中。

不过,这一切的前提是算力的充足,伴随着技术的推进与数据量的增加,在未来,算力可能仍是迈不过的那道坎。

4

股价暴涨

同花顺AI是翻新产品吗?

而在AI巨头与科技公司之外,各行各业的企业其实早已经将AI应用于实际业务中,而同花顺就是其中一员,4月14日,同花顺也将举办AI产品发布会。

实际上,同花顺的AI产品,早就已经应用,主要包括i问财、基于AI技术的增值服务产品与B端AI产品。

其中,同花顺主打的便是i问财这款AI产品。i问财是目前财经领域落地较为成功的自然语言交互问答系统,而公司也在2022年进一步加大对其研发投入,采用全新的语义解析方案,结合AI大模型、小样本学习等技术的应用,有效提升 i 问财服务效率,可将服务场景从财经领域扩展到通用领域,从中文场景扩展到多语言场景。

通过i问财机器人,我们可以获得相关资讯、数据以及AI的点评;还可以准确地提供A股公司的基本面及板块情况,并通过多类图表的形式显现出来;还可通过向问财机器人提问,实现条件选股,是市面上成功的一款财经AI。

而在AI之风的推动之下, 同花顺的股价也节节走高。自3月17日以来,在短短12个交易日中,股价便从115.57元上涨至最高的239.22元,完成快速翻倍。

在股价飙涨的背后,同花顺能否发布更有含金量的AI应用,我们还无从得知。但如果仅仅以目前的AI应用水平,是绝无可能撑起如此高的市值的。

而同花顺的AI含金量究竟如何,或许只有当其产品发布之时,我们才能知晓吧。

5

写在最后

纵观国内已经发布的文本大模型或者AI应用,亦或是与各企业相关专家进行交流,我们都能发现一个问题,那就是国内的大模型水平,实际上才刚刚起步。

在硬件方面,英伟达高端GPU遭受禁运,国内只能拿着为数不多的A100与阉割版的A800进行训练和推理。当前尚可通过丰富的训练经验,更高的资本投入来短暂掩盖国内算力严重不足的事实。但若是站在更高处,GPU发展严重落后,终将成为杀死中国AI的一把利刃。

而在算法层面,国内AI企业也面临着极为尴尬的局面,让一群善于应用创新的企业直接去做底层创新,无异于赶鸭子上架。在国外AI企业不再开源

算法后,如何找到模型开发的创新点,才是最困难的。对于一直停留在64层的众多国内GPT模型来说,想要对标ChatGPT甚至GPT-4,无异于痴人说梦。

不可否认,应用层面的“软实力”,可以让一家AI企业快速找到盈利的目标,但在真正的国产AI战争打响之后,硬件和算法层面的“硬科技”,才是我们当前最缺乏的能力。

若只重视应用层面而忽略硬件与算法层面造出来的商业辉煌,就像井中月、水中花一般,虽然美丽,但一经波澜便稍纵即逝。也只有真正拥有算力、算法层面的能力,才是中国AI发展历程中真正的进步。

我们的算力之战和算法之战刚刚拉开序幕。

此刻,中国AI的翻身之战,需要一些真正的“硬核武器”,才能正式打响。

参考资料:

《华为AI盘古大模型研究框架》,浙商证券


返回网站首页

本文评论
支付宝重组符合国家法规势在必行(支付宝资产重组)
  巨人网络董事长史玉柱今日发表微博,再度力撑阿里巴巴集团管理层就支付宝重组事件所采取的对应措施。   史玉柱说,支付宝涉及国家金融安全,法规不许外资持有,外资股东却迷...
日期:07-30
抢地盘偷帐号 “古惑仔木马”日袭万台电脑
  电影《古惑仔》中的角色为抢地盘经常大打出手,如今木马病毒也开始划分势力范围,为盗取更多帐号而和其他木马互相屏蔽排斥。近期,360安全中心截获一款伪装DNF游戏外挂的“...
日期:07-23
抖音修订《【美妆】行业管理规范》 变更类目入驻标准_美妆在抖音类目
11月3日 消息:11月3日,抖音发布关于修订《【美妆】行业管理规范》的意见征集通知。意见征集期为2022年11月3日—2022年11月10日。核心变化为变更美妆行业类目入驻标准:特殊品...
日期:11-12
马斯克和推特CEO取证时间推迟「马斯克的推特是多少」
  讯 北京时间9月27日消息,马斯克与推特因为收购纠纷闹到法庭,按照原计划,周一马斯克与推特CEO帕拉格·阿格拉瓦尔(Parag Agrawal)将会接受质询,完成取证。但知情人士透露,取证已...
日期:09-27
小程序运营从0到1的蜕变_小程序的运营模式
  ——2019即速应用小程序线下沙龙——   截至2019年,微信小程序日活用户达2亿、用户数量已突破7亿;“街电”支付宝小程序,在接入信用免押能力后订单量增长6倍;“小红书...
日期:01-08
电视剧《狂飙》热播 近期七京东《孙子兵法》搜索量同比增长近60倍
1月31日 消息:近段时间以来,电视剧《狂飙》爆火后,》孙子兵法》关注度及成交额呈现暴增态势,同名小说也已开启预售。目前已以新书5折即34元的价格在京东启动预售,并迅速成为影视...
日期:01-31
珑微系统2021生态解决方案发布会即将盛大启幕
  创新驱动发展,科技赋能未来。由成都珑微系统科技有限公司主办、英特尔(中国)有限公司协办,以“镶珑汇聚生态无界”为主题的珑微系统生态解决方案发布会,将于2021年6月8日...
日期:03-05
比亚迪高端车型即将问世「比亚迪将于 1 月 5 日发布仰望品牌及首款车型 售价或高达百万元」
12月22日消息:比亚迪官方今天公布了仰望品牌首款车型的预告图。新车定位新能源硬派越野SUV,将于2023年第一季度正式发布,售价或高达百万元左右。微软折叠屏手机duo3据介绍,仰望...
日期:12-22
荣耀magic3和x20_或与Magic 3一起发布 期待已久的荣耀X20终于被“官宣”
  近日,荣耀俱乐部开启新一期创作者招募计划,并在海报当中首次提到了荣耀X20。不少博主纷纷推测,这款第一次被官宣的这款新品,也有望在不久后与大家见面。   根据详细信息...
日期:08-17
谷歌母公司Alphabet四季度营收760.48亿美元:股价大幅下跌
今日消息,谷歌母公司Alphabet发布截至12月31日的2022财年第四季度及全年财报。报告显示,Alphabet第四季度总营收为760.48亿美元,与上年同期的753.25亿美元相比增长1%,不计入汇率...
日期:02-03
中国移动累计开通5G基站超110万个 占全国比例超50%_中国5g基站覆盖率
10月3日 消息:据新华社报道,2022年上半年中国移动5G相关投资达587亿元,截至目前,中国移动在全国已累计开通5G基站超110万个,占全国5G基站比例超过50%。此前,中国移动发布的数据显...
日期:10-03
单日市值蒸发7万亿!亚马逊启动公司最大规模裁员:计划裁掉1万人
自从10月31日以来,美股科技公司就在水深火热之中,科技股全线大跌,只有苹果稍好一些,且迅速调整回来。最惨的就是亚马逊了,这家电商巨头股价一路走低,上周三收盘甚至大跌4.3%,导致其...
日期:11-16
谷歌母公司Alphabet广告业务疲软 云业务能否扛起增长大旗?_alphabet是谷歌公司吗
智通财经APP获悉,谷歌母公司Alphabet(GOOGL.US)将于7月26日(周二)美股盘后公布2022年第二季度财报。市场预期Q2营收为702.7亿美元,每股收益为1.3美元,相比之下,上年同期营收为618.8...
日期:07-31
谷歌韩国搜索_Google欲收购韩国搜索引擎商Daum
  11月8日消息,据《韩国时报》报道,Google将加大对韩国搜索引擎市场的投入,有可能收购韩国第二大搜索引擎Daum。   据知情人士透露,Google董事长埃里克•施密特(Eric Schmi...
日期:07-24
360杀毒首家包揽国际认证“四大满贯”_360免杀认证
  国际反病毒测试机构AV-Test新一期报告显示,中国网民常用的360杀毒在安全防护、修复能力以及产品易用性等方面表现突出,成功获得AV-Test认证。此前,360杀毒已连续获得AV-C...
日期:07-23
B站国创动画发布会今晚开启:《三体》动画或正式定档_三体动画什么时候上线
根据B站官方消息,2022-2023 B站国创动画发布会将于今晚19:00正式开启,届时将公布新一批国创动漫的新消息。其中最受期待的就是国产科幻神作《三体》动画了,这是由国内艺画开天...
日期:11-04
游族网络变革:剥离非主业、聚焦卡牌和出海策略
  转自:中国经营网  本报记者 许心怡 吴可仲 北京报道  游族网络(002174.SZ)经历了一年多的业务调整后,于近日发布2022年上半年财报。报告显示,游族网络营业收入和净利润双...
日期:09-05
明星带货表演砍价被调侃演技巅峰上热搜:律师喊话先涨再降涉嫌价格欺诈
12月28日,某演员因演技好”登上热搜。这并非因为他演了一部好的影视作品,而是因为他在直播间带货时,和品牌方上演了一出演戏砍价”大戏,网友调侃他献上巅峰演技”。这种砍价剧情...
日期:12-30
华为与诺基亚续签专利交叉许可协议_华为支付诺基亚专利费
12月23日消息,今日,华为与诺基亚宣布续签双方专利许可协议,具体条款保密。nandssd硬盘价格华为坚信,保护知识产权是创新的必由之路。多年来,华为与全球主要行业厂商持续开展许可...
日期:12-23
搜狐(Nasdaq:SOHU)公布了2011财年第一季度财务报告_搜狐二季度财报
  搜狐(Nasdaq:SOHU)今天公布了2011财年第一季度财务报告。搜狐董事会主席兼CEO张朝阳、联席总裁兼COO王昕、联席总裁兼CFO余楚媛和首席技术官王小川随后召开电话会议,就财...
日期:07-27