>>返回主页
西部数据公司产品市场部副总裁朱海翔:ZB时代的数据存储核心架构 - 机遇,挑战和阶段

2019-09-03 14:20

朱海翔.png

  各位领导,各位来宾,大家下午好,我叫朱海翔,大家也可以叫我Michael, 在西部数据公司负责产品营销和市场运营。

  一年前来到ODCC,非常荣幸今年又有机会和大家分享我们在过去一年里取得的一些新的进展。这一次的分享和上次有所不同,上次我们主要谈到在HDD方面在容量的扩展上取得的一些进步。但是这次更重要的是面临即将到来的ZB级的数据时代,怎么重新审视存储的核心架构。作为一个专注存储的公司,我们遇到什么样的机遇和挑战,在这些挑战面前,怎么和业界的各位共同携手,通过技术创新的方式,把数据中心存储推向一个新的时代。

  首先来看一下闪存市场,为什么先要谈闪存市场,因为数据中心中从存储的角度,基于闪存的SSD产品是年复合增长率是最高的,达到每年44%,但是这个行业也有它独特的特性,大家可以看到它的周期性非常明显,2008年、2012年我们都经历了我们在过去的一到两年中所经历的这个市场周期性的振荡。但是最近公布的众多分析师的市场预期是在今年年底到明年年初,这个市场又会很快的回升。

  有市场供求关系的原因,但是非常重要的一点是我们已经到了数据大爆炸的新兴的边缘,我们数据的产生,随着5G、人工智能、机器学习、万物互联,我们的数据量从2018年的32个ZB会大踏步地跨入到2023年的超过100个ZB。

  在这些数据产生中,可以看到数据基本上已经形成三个不同的层面。一个是在末端数据的产生,在边缘数据得到初步的集成和分析,以及到大型云核心的数据中心,我们对数据进行计算分析,发掘出所有数据最大的价值。但是我们必须要看到数据的产生发生了一个翻天覆地的变化,在今天,我们可以看到很多的数据还是以人为产生的,微信上从文字、图片、视频,到现在非常流行的抖音、快手的小视频的迅速普及,但是从2023年可以看到,全世界超过90%的数据都会由机器产生,而不是由人产生,这些数据具有非常强烈的顺序性的流媒体数据的特性。

  针对这些爆炸性的数据我们就有必要重新审视当今的存储能不能满足数据中心、数据爆炸的发展需求。从数据中心的存储量上可以看到,在去年全球总共留存下来的数据5个ZB,到2023年快速增长到12个ZB,但是我们的问题是,真正产生的数据在2023年超过100个ZB的数据,也就是说大多数我们已经产生的数据在数据产生之后因为种种原因没有被留存下来。我们目前的存储架构、存储介质和存储密度存在巨大的挑战,无法把所有这些产生的数据留存下来,因为我们知道数据本身当它产生的时候,我们往往还不能意识到它的价值,留存之后进行再次的分析,我们才能更好的发掘出数据的价值。

  看一下数据中心中各个不同的存储介质,刚刚提到SSD的增长速率最快,但是可能很多人没有意识到,在以后的3-5年,企业级的HDD在数据中心中也会保持超过30%的高速增长。到2023年,绝大多数数据中心中我们的数据还是会存储于HDD当中,至于其他的存储方式,因为它的增长速率较慢,我们也可以把它看作存储介质中的达尔文主义,通过自然选择,可以看到2023年它在整个数据中心中所占的比例对比今天会大幅度减少。

  刚刚何所长提到一个很有意思的概念,我们的数据中心更像是IT业的房地产,我觉得闪存行业更有一点这样的味道。我把这个叫做摩尔定律和贝聿铭的结合,贝聿铭是个华人,被誉为现代建筑艺术最后的大师,他有很多著名的建筑。作为西部数据公司既有闪存也有HDD的技术,从24层到48层到64层到96层的3D MAND之后到100多层,每隔15个月我们就实现一次迭代。

  但是我想要指出的是,这就像所有的魔术师在变魔术一样,表面上让大家看到的并不是他真正的Magic所在的地方,说白了是一个线性的增长,并没有从根本上改变我们存储的密度。打一个比方,就像你想要存储更多的比特,但是你使用更多的晶元,使用更多晶元来增加存储比特的数量不是真正的扩展。再举一个例子,这是在旧金山市中心的salesforce大楼,总共有61层,和我们的64层3D NAND做比较,每一层的建造成本,salesforce大楼每平方米大概是8000美金,和我们建造64层的3D NAND是相似的,每层的增加是需要成本的,线性增加和成本的增加是成正比的,所以必须重新回到X、Y这个横向的层面,探寻如何真正增加存储的密度,也就是闪存孔的密度。

  过去几年从48到64到96层,增加了大约10%,这看起来可能是一个比较小的数字,在这个X轴上基本上看不见。但是如果我们在X、Y轴微小的增加,叠加上纵向的64层、96层的维度,就实现了真正比较可观的存储密度的增加。这时候我们再考虑第三个维度,所谓的“三驾马车”,就是在数字逻辑的维度,从SLC、MLC,增加到每单元3比特的TLC,我们就实现了相当可观的存储的扩展。实现每单元4比特,同样用高楼大厦的例子,当电梯上来的时候不是走进来3个人,而是4个人,所以QLC实现了更深度的存储密度的扩展,但是给我们也带来了挑战,要在每个单元能够感知16个电平位,这对我们在写入和写寿命上有很大的挑战。

  最终我们实现在QLC逻辑扩展的新的前沿,可以看到通过横向、纵向和逻辑三个维度,我们可以在每一个垂直的存储孔可以达到每单元422个比特,这才是魔术师真正的Magic,这是为什么闪存产品能够在数据中心中保持最高速的发展,就是这种三层叠加多维度的扩展。

  但是我们也可以看到,QLC的推广是需要一段时间的,现在可能只能在市场上看到一些低端的QLC,因为它存在自己的局限性。尽管如此,通过我们在技术上的创新,我们预计,大概在2025年,在全球数据中心中存放在SSD的介质会有50%的数据会存放在基于QLC的SSD当中,而它接受的程度和当今的TLC是不一样的,TLC最先接受和推广的重要行业是手机行业,最后是企业级的数据中心市场,QLC会完全不一样,首先采用的就会是数据中心市场,这是为什么我们在ODCC这样重要的会议上要重点提出QLC的重要性,和我们怎么能够携手通过一些技术创新,加速QLC在数据中心中的规模部署。

  QLC在这个逻辑扩展的边缘,作为每一个闪存产品的厂商,我们都会碰到设计过程中不同参数的平衡,我们要增加plane数量,增加数量的同时,Die就会增加,而封装尺寸会控制Die大小的增加;随着层数增加功耗也会增加,如果把所有数据中心的存储加在一起,功耗的增加也会是非常可观的。这个时候如果仍然要保持我们希望的页面大小,4kb,随着逻辑的扩展,写入带宽的限制就会变得越来越显著,这是我们作为这个行业需要快速解决的问题。

  总结一下,QLC我们找到了在逻辑维度,第三个维度的最新的一个扩展方向,我们可以有效的降低成本,提高TCO的收益,我们有非常好的访问和读取的性能,但是在写入方面受到限制,这是我们无法实现QLC规模扩展的一个重要原因。

  而这一点作为西部数据公司,这个问题对于我们来说似曾相识,因为我们在HDD的领域推出了所谓的SMR HDD,它在扩展、收益、读取性能和写入限制上有着非常类似的场景。可能在座有一些对于我们HDD的技术并不是非常了解,SMR HDD,翻译成中文就是叠瓦式磁记录,允许我讲一下我们硬盘的技术,硬盘在一个牒片上会叠加很多的同心圆,就是所谓的磁道,每个磁道上存储着数据。

  如果磁片上同心圆越多,也就是磁道越多,可以存储的数据越多。HDD经历了很多年,在多个个不同方面都在推动物理科学的边界,在这里我们找到了一个新的方法,就是通过叠瓦式的方法在同样面积的磁盘上摆放更多的磁道。

  叠瓦式是个非常形象的比喻,在一个楼房上,一层一层叠放的瓦片,通过堆叠的方式,可以在同样的磁片上容纳更多的存储,实现将近15-20%的数据容量的增加。这对于数据中心大规模数据的存放是非常可观的,但是它存在一个限制。我们想象一下,在这些层层相叠的瓦片中,如果我们要去更换其中的一个瓦片是不容易的。这正是SMR中写入和改变的限制。但是通过在过去五年SMR HDD和业界共同的推广,我们找到了这个分区存储的方法,我们相信按照现在的速率,到2023年全球数据中心中的HDD会有超过50%是基于SMR技术的。

  谈到分区存储技术之前,看一下数据中心的演进,尤其是从计算的角度,随着数据量的增加,随着负载应用变得更有特征化,我们可以看到通用计算实际上已经不是一个理所当然的最佳选择,这是为什么我们涌现出很多新兴的计算技术广泛应用到超大型的数据中心当中。与此相比,我们的存储技术,当然我们改变了一些接口,我们增加了一些速度,替换了一些老的协议,但是真正我们存储的架构仍然是一个通用型的存储架构,针对于数据中心,针对于这些新兴的海量数据,我们并没有重新考虑从整个存储架构的角度如何与我们的系统相配合,推出一个专用的架构,这是我们重新思考的一个新的方向。

  如果我们把数据中心看成一杆称,我们要称起ZB数据时代,我们需要更好的存储密度的扩展,我们认为我可以把分区存储技术看作这个非常重要的砝码。在下一代的数据中心当中,我们需要重新审视和搭建一种全新的存储数据架构,我们需要能够适应新型的计算技术,需要能够满足虚拟机、多租户、顺序化数据等等,而且在考虑这种新技术的时候,我们遵循和ODCC一样的准则,更好地拥抱开源,更好地拥抱标准化,和生态系统一起合作,推出全新的技术。

  在SMR HDD在过去五年商用化的过程中我们积累了很多经验,和业界共同合作,实现了SMR HDD通过一些系统的优化,在我们的数据中心中更多的应用场景的推广。我们实际上沿用了分区存储的技术,和NVMe标准化组织合作,我们推出了Zone Name Space, 分区命名空间,这沿用了同样的分区存储技术,这样我们无论是在数据中心中的HDD还是SSD,都可以使用同样的分区存储技术,从而得到效益最大化。

  那么ZNS对SSD带来了什么样的好处呢?首先是效能和成本上的降低,同比标准的NVMe SSD, DRAM减少8倍, OP (Over Provisioning)减少高达十倍!其次从功能的角度,可以实现与与下一代数据中心计算资源更好的匹配,每一个VM在每一个分区命名空间的每一个小区域内可以建立一对一和一对多的对应。原来我们所存在的写入的限制,通过分区存储技术,在HDD和SSD的推广,ZNS和SMR HDD,把写入限制变成写入管理,推出更加可靠可控的数据协同。

  在下一代的数据中心中我们有可能会碰到的三个比较主要的负载应用。传感器数据收集90%都是机器产生的数据,它存在海量数据量的特点,而且是顺序化写入,对于分区存储是没有任何问题的。

  人工智能、机器学习同样需要海量的数据量,而且需要有超高的读入性能的要求,对于分区存储也没有问题。随着从数据中心中的VM到container到目前的

  serverless, 微服务架构,同样也是需要我们对于计算资源进行更细颗粒化的分配,分区存储提供了一个更细致的一对一的分区进行匹配对应的全新的方式。

  为了能够配合行业中各个对于分区存储技术感兴趣,希望在系统端开始做一些工作,我们推出了ZNS NVMe SSD平台,欢迎大家和我们共同努力推动它在数据中心中更广泛地应用。作为西部数据公司,去年我们推出了更新更大容量的HDD,今年我们会全面推出NVMe SSD的产品,更好满足数据中心的需求。在这里很高兴和大家分享,明年我们还会推出20TB全球最大容量的SMR HDD。

  最后,非常重要的是我们推出了zonestorage.io的开源社区网站,在这里你可以看到开发工具,软件编码案例,以及架构实践等等,更方便于大家更好的开始了解,使用和推广分区存储技术。

  今天非常高兴能和大家一起分享我们在存储核心技术上的创新,是一个拥抱开源、拥抱标准的创新,ODCC为此提供了一个非常好的平台,让我们来分享这项技术。相信我们通过延展我们在SMR HDD上成功的经验,能够涵盖在数据中心中所有的规模存储介质的需求,能够和大家一起共同推动数据中心的发展和技术创新,谢谢。

0
幸运一分彩计划