公司动态

为什么企业依旧青睐HDD?

  据行业剖析机构 Trendfocus宣布的数据,2024年第一季度,寰球机器硬盘(HDD)出货量达2970万块,环比增加3%,出货总容量达262EB,环比增加22%。面向企业存储的HDD出货量跟出货容量双双增加,此中出货容量增幅高于出货量的增幅,这标明HDD仍然是企业容量需要型场景的主流抉择。  企业数据存储大抵可分为机能需要型跟容量需要型两年夜类场景,前者的典范代表是盘算类利用,平日以512B、4K等小数据块的随机读写为主,存眷点聚焦在IOPS机能;而容量需要型存储则重点考量64K、128K及以上数据块的次序读写机能(即带宽,MB/s),典范利用场景包含要害营业数据备份、文件共享、日记存储等,应用HDD为AI利用存储海量练习数据也是企业的主流抉择。  固然SSD的次序读写机能高于HDD,但对企业用户来说,现实的应用须要联合种种综合要素,除机能外,另有稳固性、牢靠性、投入本钱等多种要素。以是企业仍然青眼应用HDD来满意海量数据增加激发的存储容量需要。而HDD是怎样满意企业利用所需的呢?  本文将基于东芝的MG10-D系列氛围封装硬盘,从现实测试动身,剖析HDD在企业存储市场的上风特色。  1  基准测试:  可猜测的机能,简化企业存储庞杂度  MG10-D系列是东芝最新宣布的传统磁记载格局 (CMR) 氛围硬盘产物家属,有SATA跟SAS两种接口,容量从1TB到10TB。据东芝官网信息,MG10-D系列硬盘的机能跟电源能效均有显明晋升,同时还供给即时清算擦除(SIE)跟自加密驱动器(SED)等数据保险功效。本次测试用的HDD为3.5英寸形状规格的SATA接口硬盘,容量8TB。  图1:用于本次测试的东芝MG10-D系列磁盘,容量8TB  图2:硬盘反面  图3:硬盘接口为SATA 3.0规格,最年夜速度6Gb/s  图4:主轴电机,动员外部盘片高速扭转(7200转/分钟),并“托”起磁头实现数据存取  图5:主轴电机上方的通气孔,用以坚持表里部气压均衡,旁边有英文提醒“请勿遮挡”  基准机能测试的目标是用于评价HDD本身所能施展出的机能,即 “裸盘机能”。依据海量文件存储、数据备份、云归档等场景的数据存取特色,测试抉择用64K、128K及以上尺寸的数据块,经由过程常用的硬盘基准机能测试东西Iometer下发次序读写负载来评价HDD的带宽表示。图6为东芝MG10-D系列8TB硬盘在128K数据块下的次序读写机能。  图6:东芝MG10-D系列8TB硬盘的128K次序读写机能  本节测试应用单一线程对东芝MG10-D系列8TB硬盘下发读写负载,从测试成果能够看出,在单线程、1行列深度时,硬盘到达最年夜读写带宽,均在290MB/s阁下,此时的均匀呼应时光仅为0.46ms。  此测试成果标明了以下多层含意:  1、 次序读写机能平衡,不论是次序读(绿色柱状)仍是次序写(橙色柱状),在差别行列深度下的吞吐率都近乎类似,坚持在290MB/s阁下;  2、 在行列深度为1时,硬盘已到达最年夜的读写带宽290MB/s,利用休会稳固流利。  3、 在到达最年夜带宽后,跟着负载(行列深度)的增添,吞吐率坚持安稳,呼应时光随负载的增添而增加,这标明即便在麋集负载情形下,东芝MG10-D 8TB硬盘仍然可能施展出最年夜带宽机能,且坚持安稳,存在很好的机能可猜测性,以便企业存储体系能更好地婚配营业需要。  值得留神的是,东芝官网颁布的MG10-D系列HDD的次序读写带宽为268MiB/s,为二进制。而本测试中的290MB/s应用十进制,换算成二进制大概为278MiB/s。  图7:差别数据块巨细的次序读写机能(吞吐率与呼应时光)  上图7是东芝MG10-D系列8TB硬盘在应用64K、128K、256K、512K、1024K等差别巨细数据块下的次序读写带宽跟呼应时光表示。其机能表示趋向与上一测试成果近乎类似,在1行列深度时可到达最年夜吞吐率,且跟着负载的持续增添,吞吐率坚持稳定,呼应时光随数据块巨细而变更。  图8:东芝MG10-D系列8TB硬盘稳固性测试成果  上图8为128K数据块在连续读写下的呼应时光分布,在1分钟连续的读写负载下发中,呼应时光年夜多分布在0.4~0.5ms之间,只有少少数疏散在0.5ms之外,但均未超越0.6ms,这从另一方面表现了东芝MG10-D系列硬盘的机能稳固性与可猜测性。  从基准测试的成果数据来看,东芝MG10-D系列8TB硬盘仅需单线程单行列的情形下就能到达最年夜吞吐率,即便在麋集读写负载情形下也能坚持稳固的最年夜带宽机能,所具有的机能可猜测性,有助于企业用户简化存储体系的优化与治理任务。  基准机能测试反应的是东芝8TB硬盘自身所能施展的最年夜机能,并不代表其在现实利用中的机能表示。接上去停止的文件机能测试将展现东芝8TB硬盘的现实利用机能表示。  2  怎样让海量小文件存储更无效率?  文件存储是企业最罕见的利用场景,典范如日记存储、文件共享、云数据备份与归档等,跟着年夜数据剖析技巧的开展,海量文件存储也逐步成为企业的典范利用场景,尤其是近多少年掀起的又一轮AI怒潮,为AI模子练习所需的海量数据供给存储才能也是HDD的主要利用场景。  咱们应用VDbench创立模仿企业现实数据情况,来测试东芝10-D系列8TB硬盘,评价在处置海量小文件场景下,硬盘的每秒文件读写数,每秒吞吐率,以及呼应时光等多项表示。将东芝MG10-D系列8TB硬盘用作企业文件体系,并创立两层目次,每层10个目次,在第二层的全部目次中都创立2000个半/非构造化文件,总计20万个文件(即2000x10x10)。在差别的测试环节,VDbench会从新天生差别巨细的20万个文件(如64K、128K、256K、512K、1024K),用以评价东芝MG10-D系列8TB硬盘在差别文件巨细情形下的每秒文件读写数目跟带宽吞吐。  图9展现的是64K、128K、256K及以上差别尺寸巨细文件的次序读取与写入机能:  图9:海量小文件的次序读取/写入机能测试成果  从上图展现的测试成果来看,在64K跟128K小文件测试中,MG10-D每秒可胜利翻开并传输的文件超1000个以上,跟着文件尺寸的增年夜,每秒文件传输数开端降落,带宽则疾速晋升,在256K时到达最年夜带宽171MB/s;之后跟着文件尺寸的增添,每秒文件传输数逐步降落,带宽随之对应降落。  在文件次序写入测试中(现实是重写),64K文件每秒可写入近950个,跟着文件尺寸的增年夜,每秒写入数目逐渐下降,写入带宽则随之进步。在1MB文件时到达最年夜带宽111MB/s。  在企业数据核心内,更多利用场景的数据传输特色是文件随机读写,图10展现的是差别尺寸巨细文件的随机读取与写入机能测试成果:  图10:海量小文件随机读取/写入机能测试成果  图10测试成果表现,在20万小文件随机读取机能测试中,东芝MG10-D系列8TB硬盘在128K尺寸巨细文件时,每秒胜利翻开并传输的文件数目最多,到达137个,对HDD而言,这是一个极杰出的机能成就。随后,跟着文件尺寸的增年夜,每秒翻开数目下降,但带宽随之进步,在1MB尺寸文件时取得最年夜带宽38MB/s。  同理,在随机写入测试中,东芝MG10-D系列8TB硬盘在64K尺寸文件取得最年夜文件写入数目——每秒写入519个文件,跟着测试文件尺寸的增年夜,每秒写入数目降落,但写入带宽逐步回升,到1MB尺寸文件时取得最年夜带宽——97MB/s。  为安在文件机能测试中,随机写入机能远超随机读取机能?这是由于在测试中启用了硬盘写入缓存(Write Cache)。平日情形下,为了避免忽然失落电招致缓存数据丧失,硬盘中的写入缓存年夜多处于封闭状况。而在本次测试中之以是翻开写入缓存,这是由于东芝MG10-D系列硬盘中集成了长久写入缓存技巧,即便忽然失落电,该技巧也能保障硬盘缓存中的数据保险。而且,该系列硬盘缓存都为512MB,更年夜容量象征着能够缓存更少数据,也象征着更好的机能。  以上两个测试成果表现,东芝MG10-D系列8TB硬盘对文件随机读取的减速后果低于随机写入,这是由于测试数据全体都是从新写入的新数据,不挪用到读缓存。而在文件随机写入测试中,下发的负载起首写入硬盘的写缓存(并经由排序),而后以相似次序写入的方法写入硬盘,从测试成果来看,其减速后果十分显明,在64K文件巨细时,每秒随机写入的文件数目约为次序写入的55%,跟着文件尺寸的增年夜,减速后果更加显明,在1MB文件巨细时,随机写入带宽濒临次序写入带宽的90%(87%)。  在海量小文件存储体系中,存储的文件数目也会对文件读写机能带来影响(其余设置稳定的情形下),此测试将评价128K尺寸文件巨细下,差别文件数目对读写机能带来的影响,图11为测试成果:  图11:差别文件数目对存储机能的影响  在文件随机读取测试中,跟着文件体系中文件数目的增添,每秒胜利翻开并传输的文件数目会随之降落,在超越10万个文件后,读取机能趋于陡峭,呼应时光也保持稳固。而在文件随机写入测试中,因为写入缓存的减速,固然文件体系内文件数目明显增添,但每秒胜利写入的文件数目仍然安稳,呼应时光也不很年夜崎岖,得益于缓存明显晋升了企业文件体系的机能,尤其是写入机能。  上述成果均基于单机情况下对单块东芝MG10-D系列8TB硬盘停止测试取得,在企业现实情况中,存储体系平日有着数目多得多的硬盘。比方散布式存储,即便最小3节点也有多达36块硬盘,假如按上述测试数据推算,其能支撑每秒最多3.6万个文件的并发拜访。即便安排在传统双控阵列(12块硬盘)中,也能支撑每秒最多近1.2万个文件的并发拜访。更况且另有存储体系的内存/缓存加持,实现的体系综合现实性可高于上述数值。  本测试综合斟酌HDD的机能后抉择应用的是单机情况(i5-13600,[email protected],32G内存)停止测试,在测试中消除了体系内存、收集等要素的影响。在企业现实情况,如文件共享利用中,文件体系(NAS)缓存将会对文件读写机能带来利好,但差别的存储收集(GbE vs FC、10GbE vs 25GbE等)则会对测试成果带来较年夜影响,同时,客户端并发数目、读写负载混杂比例等都市差别水平上影响文件体系机能。  3  除了机能,硬盘另有其余长处  东芝MG10-D系列硬盘是东芝专为企业存储而研发改良的传统磁记载格局(CMR)硬盘家属,除了上述测试中所反应出的机能稳固性、可猜测性外,为满意企业存储需要,东芝MG10-D系列硬盘另有着良多特色及可抉择的附加功效,比方:  即时清算擦除(SIE)跟自加密功效(SED)。良多企业,尤其是有着年夜范围数据核心的企业,因毛病调换硬盘、报废硬盘后,怎样处置被镌汰硬盘平日是一个困难,其上可能寄存着企业敏感数据。而应用这两项保险功效,能辅助企业更好地处置数据保险危险。东芝MG10-D全容量系列硬盘均支撑这两项功效。  长久写入缓存技巧。可在保障最优写入机能(Write Cache启用)的基本上防备因为忽然失落电招致缓存数据丧失的危险,辅助企业在保障数据保险的同时更好地应答突发营业波峰。  存储抉择更机动。东芝MG10-D系列硬盘不只供给用于构建散布式存储的SATA接口硬盘,还供给满意企业存储阵列需要的SAS接口硬盘;企业还可依据营业所需机动抉择512e/4Kn或512n等差别扇区格局的硬盘,可无缝融入企业种种营业场景;1TB起步、最高10TB的容量规格也让企业领有更机动的抉择。  图12:东芝MG10-D系列供给差别规格型号的硬盘,供企业按需要机动抉择  除上述特色以外,东芝MG10-D系列硬盘每年额外任务负载总传输率可达550TB;同时还存在很好的电源能效,在活泼待机形式下的功耗降至5.74W,比拟上一代产物能耗节俭方面也有很年夜晋升。对凑集了数万台效劳器的企业数据核心,每一瓦的能耗节俭都能为用户带来更好的本钱管把持。  在良多企业数据核心的主流利用场景,HDD以其可猜测的机能、更具性价比的投入、教训证的牢靠性、更机动的容量与接口抉择,以及优良的兼容性等特色,可能更好地支持企业营业的畸形稳固运转。   申明:新浪网独家稿件,未经受权制止转载。 -->