您的位置:首页 > 互联网

华为做起AI淘金时代“卖铲人”,天才少年透露“秘密武器”

发布时间:2023-07-16 11:56:38  来源:互联网     背景:

7月14日,华为面向AI大模型时代又有大动作,发布了两款新品,为基础模型训练、行业模型训练,以及细分场景模型的训练和推理提供存储解决方案,以更好地释放AI新动能。


华为数据存储产品线总裁周跃峰发布AI存储新品

就在7天前的华为开发者大会2023(Cloud)上,华为发布了面向行业的大模型系列——盘古大模型3.0,可以提供100亿参数、380亿参数、710参数和1000亿参数的系列化基础大模型,匹配不同场景、不同时延、不同响应速度的行业多样化需求,包括NLP大模型的知识问答、文案生成、代码生成,以及多模态大模型的图像生成、图像理解等能力。

自2022年11月ChatGPT问世以来,以预训练大模型等为代表的新兴技术掀起加速了新一代人工智能的发展,全球掀起AI大模型军备竞赛。在这场竞赛中,华为除了面向行业应用推出系列大模型,也做起了AI淘金时代“卖铲人”。

AI淘金时代,华为做起“卖铲人”

AI大模型时代的三要素:算力、算法和数据。在华为数据存储产品线总裁周跃峰看来,数据以及数据的质量决定人工智能智力的高度。发展人工智能产业,要重视数据和信息的数字化记录。

据周跃峰观察,国外ChatGPT大模型的训练效率更高一些、容易一些,其核心的原因就在于在数字化阶段,更多的英文资料被记录了下来,远远多于中文资料。而我国发展了大量的数据中心,算力相对来说比较多,而存力还比较少,很多高价值的信息没有被记录下来,长此以往这将会制约我国人工智能产业的高质量发展。

而对于企业而言,在开发及实施大模型应用过程中,由于数据存储的问题也面临四大挑战。周跃峰指出,首先,数据准备时间长,数据来源分散,归集慢,预处理百TB数据需10天左右;其次,多模态大模型以海量文本、图片为训练集,当前海量小文件的加载速度不足100MB/s,训练集加载效率低;第三,大模型参数频繁调优,训练平台不稳定,平均约2天出现一次训练中断,需要Checkpoint机制恢复训练,故障恢复耗时超过一天;最后,大模型实施门槛高,系统搭建繁杂,资源调度难,GPU资源利用率通常不到40%。

在7月14日的发布会上,华为顺应大模型时代AI发展趋势,针对不同行业、不同场景大模型应用,推出OceanStor A310深度学习数据湖存储与FusionCube A3000训/推超融合一体机。

小米5g印度市场手机价格

周跃峰介绍,OceanStor A310为智能数据而生,可以实现从数据归集、预处理到模型训练、推理整个的存储支撑的工作。OceanStor A310支持96闪存盘,带宽达到400G/秒。也就是说,每秒钟可以传200多部高清的电影。IOPS达到1200万,最高支持4096个节点的横向扩展。而通过近存计算实现近数据预处理,减少数据搬移,预处理效率提升30 %。

而FusionCube A3000训/推超融合一体机,则面向行业大模型训练/推理场景,针对百亿级模型应用,集成OceanStor A300高性能存储节点、训/推节点、交换设备、AI平台软件与管理运维软件,为大模型企业提供一站式的部署交付体验。

周跃峰介绍,该一体机的训/推节点与存储节点均可独立水平扩展,以匹配不同规模的模型需求。同时FusionCube A3000通过高性能容器实现多个模型训练推理任务共享GPU,将资源利用率从40%提升到70%以上。

华为数据存储产品线总裁周跃峰表示:“大模型时代,数据决定AI智能的高度。作为数据的载体,数据存储成为AI大模型的关键基础设施。华为数据存储未来将持续创新,面向AI大模型时代提供多样化的方案与产品,携手伙伴共同推进AI赋能千行百业。”

华为天才少年透露“秘密武器”

大模型的训练和应用涉及海量数据,大模型厂商尤为关注的是如何保障数据的安全流转问题。在当天的发布会上,华为天才少年、华为苏黎士研究所数据存储首席科学家张霁,对此进行了深入解读。他表示,AI大模型与前些年非常火爆的深度学习相比,除了模型本身发生一些变化以外,最大的特点就是数据量变得更大。从很大程度上来讲,高质量的数据决定了AI大模型的上限,而算法和算力只是去无限逼近这个上限。

张霁介绍,数据存储作为数据安全的第一道防线,企业如何能够安全地把数据从不同的地点、不同的节点归集到一个地方,面临非常大的挑战。因此,华为正在研究一种“数据方舱”技术,将数据在流转的过程中把数据以及它的相关凭证、隐私、权限等信息跟数据放在一起进行流转。当这些数据到达了数据归集地之后,这些数据在方舱当中就能得以安全地执行和保护,从而做到数据的极致安全。

目前,华为的“数据方舱”正在跟中信银行、云上贵州等一些客户做联合的技术创新和实践,华为希望通过“数据方舱”能够让来自不同行业的高价值数据实现安全流转。周跃峰认为:“只有数据能够安全流转,AI包括AI大模型,未来才可以得到长久的持续的发展。”

而在数据安全流转之外,大模型厂商还普遍关注AI大模型在实施过程中的成本问题,这关乎数据如何能够快速地接入AI大模型,高效完成储存、训练、推理等一系列动作。

张霁表示,企业如果说需要去快速接入AI大模型,一是在基础大模型上做二次的训练,这对GPU的消耗非常高,会导致成本非常高。而最关键的是它需要有专人去维护所在的垂直专业的领域知识,非常耗时耗力;二是得益于万物皆向量的理念,华为面向AI大模型去研究向量存储技术。向量存储技术类似于AI外挂一个存储,可以把企业最新的垂直化的数据向量化进行存储和检索,从而大幅度去降低企业接入和使用AI大模型的难度。

张霁介绍,向量存储技术当前还处于萌芽但快速发展的阶段,华为在海外已经进行了非常前沿的布局,例如为了解决向量存储当中对数十亿甚至上百亿的向量如何快速的进行模糊查找、聚类的处理,华为苏黎士研究所和华为海思硬件团队进行了联合创新,通过近存计算、软硬协同的方式,去加速向量的检索。

张霁表示,华为也利用本地的资源,跟欧洲的一些顶尖高校进行产学研合作,希望未来在以数据为中心的体系结构变革的大背景下,利用算法和架构协同的方式,通过存内计算、新型的数据存储格式,去真正释放数据的价值,卸载部分GPU和CPU服务器的算力,节省无效的数据搬移带来的能耗问题,从而最终推动数据新范式的快速的发展。

周跃峰称,“数据方舱”和向量存储技术,正是华为面向AI大模型时代正在研发中的“秘密武器”。

采写:南都湾财社记者 程洋


返回网站首页

本文评论
网易云音乐App下架,原因未知(网易云音乐app store没有了)
  6月29日消息 今天早晨,经网友反馈,网易云音乐App遭到各大应用商店下架,原因未知。   目前,安卓方面的各大应用商店已经无法下载网易云音乐App,苹果App Store尚可下载,网易...
日期:10-16
雅虎董事长认可巴茨表现 当场遭股东强烈批评(雅虎ceo巴茨)
北京时间6月24日消息,据国外媒体报道,在周四的雅虎年度股东大会上,雅虎董事长罗伊·博斯托克(Roy Bostock)为雅虎CEO卡罗尔·巴茨(Carol Bartz)的工作表现辩护,但此举当场引起...
日期:07-30
滴滴自动驾驶:2025年将推出首款量产L4无人驾驶新能源车
5月10日消息,滴滴自动驾驶与广汽埃安共同发布无人驾驶新能源量产车项目“AIDI计划”,并宣布将成立合资公司。这是继2021年滴滴自动驾驶和广汽埃安签署战略合作后,双方首次对外...
日期:05-10
数字藏品交易要注意知识产权问题(数字藏品可以交易吗)
转自:经济参考报   平面设计师Beeple的作品《每一天:最初的5000天》。资料图片   2021年3月,一件名为《每一天:最初的5000天》的NFT艺术品以超6900万美元在佳士得拍卖会场...
日期:08-21
董勤峰:个人英雄时代已经远去站长需自强求变
  嘉宾谈2010中国互联网站长年会:个人英雄时代已经远去站长需自强求变   董勤峰 浙江绍兴人,网名“拒绝游泳的鱼”。   1974年生人。96年上网,98年制作个人主页“落伍的...
日期:07-29
单位年会iPad派得太多 网友纷纷网上出货_公司发的ipad
  去年底很给力的两个词是iPhone4、iPad,过了一个年,它们依然被大家所津津乐道,只是方式不同而已。   “单位团拜一等奖,32G+WIFI+3G,全新,因自己已有只iPad了,故转让之,奖品...
日期:07-26
叮咚买菜:国庆期间预制菜销量同比增长60%「叮咚买菜发展现状」
10月8日 消息:国庆期间,叮咚买菜平台迎来订单高峰。近几日,火锅、烧烤类预制菜销量增长迅猛。今年国庆,由于市民减少了远途出行,更多人会选择家庭聚餐、近郊出行、露营等休闲方...
日期:10-15
iqoo8120hz「骁龙之王!iQOO 11S搭载鸡血版骁龙8 Gen2:CPU狂飙至3.36GHz」
快科技5月26日消息,博主数码闲聊站透露,iQOO 11S将会搭载高通鸡血版骁龙8 Gen2移动平台,这颗芯片是高通公司迄今为止最强悍的5G Soc,iQOO 11S由此成为了最强悍的骁龙手机。iphon...
日期:05-27
迷你500私人飞机「票价360元 男子坐迷你飞机仅9座无空姐无厕所:内部还没SUV高」
你见过没有空姐、不配厕所的航班吗?据媒体报道,7月12日,在黑龙江哈尔滨,张先生出行遇超迷你通航飞机,从哈尔滨到嫩江票价是360元,上飞机后发现总共仅9个座位,机舱内无卫生间,没有空...
日期:07-14
谷歌Android 12_17日:谷歌I/O将推Android 2.2等产品
  美国   pcworld.com:微软称Office 2010是Office软件中最简单的版本   微软称,Office 2010是这个软件中最具创新的和最容易使用的版本。用户很容易从以前的版本升级到...
日期:07-29
三星q25「三星Q2利润恐暴跌96% 主要原因是芯片过剩」
三星电子预计2023年6月季度的利润将大幅下滑。分析师预测,该公司的营业利润将同比下降96%,至5550亿韩元(4.27亿美元)。如果这一估计成真,那么根据路透社的报道,这将是三星14年来最...
日期:07-07
英伟达、英特尔、AMD等芯片巨头集体萎靡,PC销售热潮已退_英特尔加快AI芯片交付抢市场,与英伟达竞争升级
我要买小度真无线智能耳机广汽三菱的广告自然堂护肤品牌卖一部iphone的利润ipad2018亮度   过去近两年,当疫情期间人们被隔离在家时,PC出货量出现爆发式增长。而现在,这样的...
日期:08-16
制冷好耗电就大?海尔空调制冷好还省电_海尔空调制冷耗电量
  对空调来说,科技创新的一小步,就是用户美好生活的一大步。例如,从窗机到分体机的进阶,让用户告别了室内噪音困扰;定频到变频的变革,让空调能耗大大降低,控温更精准。现在,一场极...
日期:07-12
iphone高温会关机吗「用户吐槽高温季 iPhone 发烫影响使用 苹果回应」
随着天气逐渐升温,苹果手机在高温环境下发烫严重一直是使用该品牌手机的用户们的烦恼。最近,一些网友纷纷在社交媒体平台上抱怨iPhone在高温季的发烫问题,而相对来说安卓手机则...
日期:07-15
Shopee衰落幕后:一家最像中国大厂的东南亚巨头的全球化乱局_shopee简史
  作者|沈丹阳   当一家东南亚互联网公司,像极了一家中国互联网大厂,会发生什么?   对于新加坡互联网集团SEA旗下的明星公司Shopee来说,一开始,这意味着疯狂的增长。   ...
日期:08-10
空间站“酒驾”会因太空环境加剧酒精效应吗?
  2018年9月,太空技术取得了一项新的“突破”:一个特殊设计的瓶子使在太空微重力环境下喝香槟成为可能。正如报道中所详细描述的,这个瓶子包含两个腔体,一个用于盛放香槟,另一...
日期:05-01
魅族 20 / 20 Pro 金银色外观曝光,这颜值绝了_魅族pro5金色
2023年3月14日消息,今日数码博主 @数码闲聊站 发布爆料称,魅族20和魅族20Pro 全系搭载骁龙8Gen2处理器与柔性直屏,配备50Mp OIS 大底主摄、超声波屏下指纹,支持80W 闪充。其中,魅...
日期:03-15
爱玛A500发布 整车正向开发流程第一车_爱玛A500详细配置
  “电动车的拼车范式已近终点,造车时代已经到来。”   4月10日,爱玛科技集团携手深圳卫视《超级发布会》发布划时代新品——爱玛A500。A500被定义为造车时代的第一款车...
日期:02-25
《使命召唤:现代战争》PC配置要求公布:需要175GB硬盘空间_使命召唤现代战争游戏配置
  10月10日消息 据外媒Charlieintel消息,暴雪战网现已公布《使命召唤:现代战争》PC配置要求,包括最低配置要求与推荐配置要求。信息显示,存储《使命召唤:现代战争》需要175GB...
日期:11-21
“链改”进行时,时迈科技找到市场突破口
  在高层召开会议定调之后,区块链已被明确作为核心技术自主创新的重要突破口。与之前大众将关注点主要放在“币圈”炒作的状况迥异,现在业内探讨更多的是有关区块链如何赋...
日期:06-09