您的位置:首页 > 互联网

从里德-所罗门算法到Flex EC,数学是华为云真正的“硬核”

发布时间:2020-07-08 15:14:36  来源:互联网     背景:

   “宇宙之大,粒子之微,火箭之速,化工之巧,地球之变,生物之谜,日用之繁,无处不用到数学”

                                                                                                                                             ----华罗庚

  2012年,一本由吴军博士编著的《数学之美》畅销中国,书中将高深的数学原理讲得更加通俗易懂,让非专业读者也能领略数学的魅力。吴军博士在书中提到知名的计算机科学家Randy Katz发明了RAID(计算机独立磁盘冗余阵列)系统,而正是RAID技术奠定了商用存储系统高性能高可靠的根基。RAID的核心思想就是使用EC(Erasure Code)纠错码来灵活地配置数据冗余度,在保持存储系统高性能高可靠的基础上,提供比多副本技术更优的存储利用率。

    一.Erasure Code和Reed-SolomonCodes:

  随着云计算领域的发展,云端算力成指数型增长,5G和AI应用的崛起,海量的数据上云已经是不可逆的趋势,而云存储系统所管理的数据已经从传统企业存储TB级迈向了EB级(1EB = 1 000 000 TB),在云存储发展初期,受限于技术能力,各云存储厂商主要沿用多副本机制(通常是3副本),导致云存储系统的空间利用率只有33%,数据存储成本高居不下,而后业界通常采用EC方式来降低成本。

  传统的的EC(Erasure Code) 纠错码使用的是里德-所罗门码(Reed-Solomon Codes,简称RS Codes),其在云存储系统中应用方式为:

  把云存储(主要是公有云对象存储系统)的所有存储单元(单硬盘或存储节点)视为一个Erasure Code存储池,可以将对象按照N+M的方式存储(N为对象的数据分片,M为校验片),它将对象切分成N个数据片,M个校验片。以6+3的EC为例,空间利用率可以达到67%,更大比例的N+M将会具有更高的空间利用率,在成本上非常具有竞争力,同时,系统的吞吐量较3副本(或多副本)有较大的提升。因此,EC技术在云存储领域得到大规模的应用。

  但是传统的EC机制在公有云场景下,面临着以下诸多问题:

  1、在对象大小不确定的场景下,需进行补零和填充计算,浪费存储空间,成本较高。

  2、如不补零, 需进行多次覆盖写以保证EC成员组的原子性。会导致系统复杂度提升,吞吐量降低,需配置更快的CPU和更大的网络带宽,存储成本增加。

  3、此外,还有一种增加Cache-Tier的方式以避免EC时单元不满的问题:先以3副本的形式写入高性能的SSD Tier,凑满EC单元后再进行计算和搬移至HDD Tier。这种off-line的EC方式,其缺点有:

  a)额外的SSDTier,成本高;

  b)持续写入对SSD可靠性的挑战;

  c)数据搬移消耗大量内部带宽。

  4、传统的EC在大比例N+M(如20+3)下,如果出现节点/介质故障,就需要读取大量数据片和校验片进行数据重构,会导致系统性能陡降。

  基于以上,我们可以知道,衡量一个使用EC的数据存储系统的优劣可以通过以下几个维度来综合考虑:

  1、高效的空间利用率:一个系统能够稳定地提供多少空间利用率,在给定的N+M,空间利用率恒定。

  2、高效的写入性能:无论业务层如何变化,对象的大小如何变化,应该有恒定的写入带宽、IOPS等。

  3、高效的重构性能:尽可能少的系统重构IO带宽,尽可能少的占用跨AZ/DC的网络带宽。

  二.华为云“On-line Streaming Erasure Coding”和“Flex Erasure Coding”:

  华为云OBS服务通过创新的“On-line Streaming Erasure Coding”和” Flex Erasure Coding”提供on-line的Erasure Coding存储机制,在公有云对象存储系统中解决了上述的几个关键问题。

  1、On-line Streaming Erasure Coding

  如下图所示,整系统的核心部件是Streaming ErasureCoding Unit, 多个对象的数据可以流入处理单元,由其进行encoding操作。通过多个对象数据的combine,可以消除对象不满时,数据写入补零计算浪费的空间。

从里德-所罗门算法到Flex EC,数学是华为云真正的“硬核”

  此过程不需要复杂低效的分布式事务,也不需要读取已经写入的数据。通过这个Streaming ErasureCoding Unit,提供on-line的EC机制,避免内部的数据搬迁动作。

  2、Flex Erasure Coding算法:

  华为云通过应用全新的Flex Erasure Coding编解码算法,在保持数据重构效率的基础上,重构带宽需求大幅度降低,极大地提升了故障时数据重构性能,有效地缩短了重构用时,保证数据的持久度和系统吞吐量。

  通过上面2个自研算法,华为云OBS单流带宽达到业界友商的3~5倍,超过300MB/S,超千万并发链接能力,并且在高业务负荷下仍然保持稳定低时延,整体性能和空间利用率相比多副本或传统EC技术大幅提升:

  在大数据应用场景,由于写放大极具减少,单流带宽大幅提升,大数据对象case下性能倍数提升,用户能更快地获取数据分析结果。

  在IOT场景,海量的IOT设备都需要实时向云端进行数据传输,而OBS超千万的并发能力,能支撑数亿IOT设备的连接访问。

  在视频应用(视频监控,直播和点播)场景,华为云OBS的稳定低时延支撑高画质视频快速播放且无卡顿。

  在更多的应用场景中,华为云OBS 用同样出色的表现证明:数学算法的优化能让软件产品能力再次领先业界一个时代。

   三.软件的灵魂是算法,算法的硬核是数学

  “我认为用物理方法来解决问题已趋近饱和,要重视数学方法的突起。”——任正非

  正是由于华为在数学领域长期持续的投入,让其在云+AI+5G时代的产品具有领先的竞争力。

  早在1999年,华为就在俄罗斯成立了专门的算法研究所,基于俄罗斯科学家的数学能力,连续突破了3G/4G移动网络技术特殊瓶颈,使华为成为全球4G移动网络设备的领导者。而在2016年,华为再次宣布在法国设立欧洲第二个数学研究所,继续加强基础科学研究。

  除了在俄罗斯和法国建立的数学研究所,华为还积极参与并投资包括中国在内的全球数学家的科研项目,积极推动数学研究和数学成果在产业的落地。在华为的长期支持下,Erdal Arikan教授在Polar码上取得了多项突破,最终成为5G控制信道编码标准,推动了通信技术的发展。

  而正是基于数学和其他基础科学研究成果在芯片设计、集成电路开发、软件算法和质量管理等方面的应用,华为才能成为ICT行业的长跑选手,并且能在外部环境风云变幻的当下,保持着持续前行的动力。

从里德-所罗门算法到Flex EC,数学是华为云真正的“硬核”

  华为曾在其官方媒体上发表了《基础研究与基础教育是产业诞生和振兴的根本》(链接)的文章,以官宣的方式阐述了基础研究特别是数学研究对产业发展的贡献,更是提出了“数学是开启一切的工具”的论断。

  数学,是华为继续前行指路灯,也是华为云真正的“硬核”实力。


网络动态ip是什么意思

京东干掉阿里巴巴

返回网站首页

芯片需求下降


lg gram 2020 上市

Facebook 扎克伯格

BAT 移动战事未决
读懂“失陪儿童”与“留守儿童”:一个孩子不该有的称呼

当贝x3投影仪致命缺点

amd usb驱动


返回网站首页

本文评论
讯飞翻译笔生词导出_如何快速查生词?讯飞翻译笔让孩子的学习更高效
  前几天我家孩子的期中考试成绩下来了,他考得不错,总分和排名都位居班级前列,我也很替他高兴,不过看到了他的英语成绩之后,我不禁开始担心起来。我家孩子今年初二,其它学科的...
日期:07-16
科大讯飞q10怎么样_教育硬件再推新品,科大讯飞发布高性价比讯飞智能学习机Q10
  过去的一年对于教育行业而言充满考验,随之而来的是A.I.+线上教育的深入发展,其中,科大讯飞深耕智慧教育17年,由B端到C端,不断开拓思路深入布局,为越来越多的孩子提供因材施教...
日期:04-22
资深果粉分享:iPhone14 Pro的升级和槽点_iphone11promax升级ios14.4怎么样
随着每年9月的“科技春晚”的落幕,今年的新款iPhone 也公诸于世。作为果粉的我,也第一时间入手了iPhone 14 Pro 银色版。使用了一段时间沉浸在新机的喜悦同时,来分享一些我对新...
日期:10-14
2499元起!vivo S16发布:骁龙870加持「865骁龙vivo」
今晚,vivo新品发布会如期而至,vivo S16正式发布,起售价2499元。苹果15ultra爆料核心配置上,vivo S16采用6.78英寸120Hz 10亿色超感屏,搭载高通骁龙870芯片,前置5000万像素,后置6400...
日期:12-23
酷狗音乐蝰蛇音效 让耳朵享受黑科技_酷狗的蝰蛇音效
  据《音效行业白皮书》显示,80%以上消费者每天听音乐1次以上,听音乐时长超过半小时。庞大的音乐用户群体中,高达89%的消费者会选择添加音效。其中,音效发挥的作用不仅仅在于...
日期:07-16
马斯克回应完成推特私有化交易:推特自由了「马斯克推特最新新闻」
10 月 28 日讯:今日,在完成收购推特,并将其私有化后,特斯拉CEO马斯克在推特上发文:“推特自由了。”小米redmi10华为mate40e 5g值得买吗ipad pro充电效率特斯拉今年的目标...
日期:10-28
我国成功发射可重复使用试验航天器「我国成功发射第一艘载人航天试验飞船是」
今天是太空与您相伴的【第1564期】oppo find x6 pro上市时间nothing phone国外售价 2022年8月5日,我国在酒泉卫星发射中心,运用长征二号F运载火箭,成功发射一型可重复使用的...
日期:09-24
外媒爆料华为海思下月发布麒麟990 5G基带领先高通半年以上_华为海思麒麟990相当于骁龙多少
  报道中提到,Mate 30系列会在今年9月19日亮相,而在这之前 ,华为将在德国IFA大会上发布麒麟新一代旗舰处理器,命名上可能直接跳过原来的方式,既冠以麒麟990的称号。   8月1...
日期:10-08
富士康涉嫌就业歧视被告上法庭(富士康起诉第一财经日报)
  重庆妹子小雪(化名)曾因年幼时肺结核痊愈后形成“右上肺钙化灶”,即陈旧性肺结核,她在应聘富士康集团鸿富锦精密电子(重庆)有限公司(以下简称富士康鸿富锦)采购部职位时,...
日期:07-23
美国云计算上市公司_美国云计算软件股纷纷大涨 需求仍强劲
撼讯6600xt显卡   讯 北京时间8月15日早间消息,据报道,今年年初,美国云计算软件股纷纷下跌,但现在许多股票的价格已经较低点反弹50%。过去三个月WisdomTree云计算基金上涨26%,...
日期:08-16
墨迹天气掘金B端千亿气象市场_墨迹空气指数实时预报
  在人口流量红利被挖掘殆尽的当下,互联网企业共同选择的破局之匙是从C端消费互联网向B端产业互联网积极转型。不过,对墨迹天气而言,这或许并不是“转型”,而是更准确的...
日期:07-24
苹果 iPhone 13 Pro“终极”渲染图曝光:刘海缩小,后置镜头模组将有大幅升级
  根据此前多方预测的消息,今年苹果将继续在 9 月推出全新的 iPhone 13 系列机型(也有消息称为 iPhone 12s 系列),按照往年惯例,今年的新 iPhone 的升级可能并不会太大,但迄...
日期:01-17
永辉披露到家业务新进展:“仓店合一”模式开启多城试点「永辉超市到家业务」
  讯 9月26日晚间消息,永辉超市近日召开2022年半年度线上业绩说明会。会上,永辉超市CEO李松峰表示:“永辉上半年到家业务亏损率已从原来的7.9%下降到1.6%,线上占比持续提高,盈...
日期:09-27
小天才官方禁用是什么意思?_“小天才”被责令封禁不良应用
本报讯(记者;;王薇)对确认违规App立即下架永不上架,对已经下载的不良应用进行封禁,家长端App增加“远程安装”功能等。昨天,北京市消费者协会、天津市消费者协会、河北省消费者权...
日期:08-20
中国互联网上市两大“法宝”:用户+增长
  墙内开花墙外也香,海外资本市场的中国概念股也迎来了属于自己的“春天”。   今年一季度陆续爆发的中东和北非政局巨变以及接踵而来的日本地震增加了市场对于政治格局...
日期:07-27
奈飞和腾讯,谁更《三体》?「三体电视剧奈飞」
声明:本文来自于微信公众号 字母榜(ID:wujicaijing),作者:毕安娣,授权转载发布。没到真的开播,一律当吹牛——如果你喜欢刘慈欣的科幻巨作《三体》,并经历了多年来的希望与失望的...
日期:10-01
SW-LIMS助力食品实验室资源要求的实现及应用
  随着物质条件愈加丰富,人们的生活越来越好,食品安全也成为了社会持续关注的焦点。社会对食品检验检测的需求不断变大,对食品检验检测的要求也不断提高,这极大地促进了食品...
日期:07-17
飞书总裁张楠:企业管理依赖充分客观的一手信息
讯 7月28日上午消息,在飞书城市峰会上,飞书总裁张楠谈到,“越是不确定的大环境,就越需要我们这些管理者具备预见趋势、洞察先机的‘超能力’。所谓超能力,在我看来就是更深刻地感...
日期:07-31
华谊兄弟入股元宇宙公司 元宇宙成了影视公司的救命稻草吗?_华谊兄弟电影世界是谁投资的
  财联社|元宇宙NEWS 10月14日讯(记者 徐赐豪) 华谊兄弟在元宇宙方面有了新的动向。元宇宙文化娱乐管理(青岛)有限公司新增华谊兄弟互娱(天津)投资有限公司成为公司股东,持股比例...
日期:10-14
为什么好多酒店退出oyo_OYO酒店,为何能成为出行首选
  酒店好似旅途中的“精力充电站”,保障了良好的睡眠质量,第二天才能精力充沛的游玩,才能让旅行更加完美。过去的旅行人们为了拥有良好的酒店环境,只好花费更高的价钱,甚...
日期:06-27