7.5.2.4案例研究:近线系统
基于数据磁带的数字近线系统(占整个大规模存储系统大约一半的成本)最可能与所安装的磁带驱动数目和所用磁带的数目一起升级。每个磁带有一定的存储容量。
为了做出近线系统随时间变化的成本模型,这里给出下面一些假设:
·每季度有大约2 500小时的资料要录入近线系统。
·使用50Mb/s的归档格式。
·第一代磁带的净容量为50GB。
·每2年新一代的磁带驱动提供的净磁带容量增长一倍。
·当新一代磁带驱动可用时开始迁移。
·每2年引入一种新的磁带驱动技术。
·出于迁移目的,平均2个磁带驱动用于读访问,一个用于写访问。
·该模型开始于2000年。
为了与新的磁带驱动的有效性相匹配,当第二代磁带驱动可用时开始第一代的迁移。为保持2年发展周期的步伐,每2年要进行一次新的迁移步骤。迁移时,2个驱动读,一个驱动写。
这种方式得出的保存在磁带库中的磁带的总体数目与时间的关系。如果不迁移,所要管理的磁带数量呈线性增长,每季度以2 500小时的速度线性增长。使用上面介绍的迁移策略,带库所要保存的磁带数量在2年后达到最大,在4年后稳步减少。
这意味着以这种方式设计近线系统就足够了,它能够保留所需的磁带用于存储前2年录入的所有资料,加上根据需求确定的一定水平的冗余度。因此,近线系统(即磁带数量以常量增加)的一个成本因素得到有效地减少。另外的一个好处是数据磁带在库中停留的时间被清楚的定义了,即最少2年,最多4年。这能最大限度地降低由于载体年限造成的数据丢失。因此,保证数据完整性的可能附加成本是最少的。
采用这种方式意味着磁带要频繁的交换和丢弃(退役),因此这种迁移带来了购买所有这些磁带的附加成本问题。为了对此研究,我们做了一个额外的假设:
·新一代兼容磁带驱动的初始成本大致与上一代磁带引入时的成本一样。
旧的磁带的生产价格可能比下一代磁带引入的价格要低,但从长远来看它会变得更贵,因为对这些磁带的市场需求会减少。因此我们假设,不论是哪一代磁带,平均每一盒磁带的价格基本一样,尽管它们的存储容量不同。
如果我们继续使用第一代的磁带驱动和相匹配的磁带来增加文档存储的容量,引进的磁带数量随时间线性增加。非常有趣的是,使用迁移方式能保持引进磁带的数量总是在或低于线性情况的水平。从长远来看,与不迁移的情况相比,迁移解决方案还具有所需购买的磁带数量减少的优势。
应用磁带价格不变的假设,磁带的整个成本并不会因迁移而增加。而且,长期来看甚至还有净利润。因此,当使用所建议的迁移方案时,我们可以总结如下:
·近线系统中所要存储的磁带的数量在2年后达到最大,这个数量可被用作磁带库大小的初始设计标准。
·迁移方案并没有增加载体(数据磁带盒)的额外成本,即从长期来看,要购买的磁带盒的数量甚至在减少。
·库中的数据磁带不会超过4年。因此保持磁带的有效使用时间在2年以下是可能的,这对长期保存的数据完整性是非常有帮助的。
为了利用这一点,这里建议设计近线系统的一些指导方式。首先,要选择合适的数据磁带驱动族来满足初始的容量、装载时间、查找时间和传输率的需求,并且要能提供一种与迁移方案一致的观点。后一点意味着对容量和传输率的增加应该有一个可信的发展方向。而且,所选择的数据磁带库要支持所选的磁带驱动族,并且在槽的数量和可安装的磁带驱动的数量方面能充分地扩充。所选库的大小要能满足最初2年输入的需求。要有一些防备不可预知事情的措施,包括附加的容量用于对不可预知的输入增加所产生的内部冗余。而且,需要一些备用的磁带来保证存储的完备性管理。
近线系统成本中要考虑的最后一点是磁带驱动的成本。为了评估驱动牵涉的成本,先要做一些假设。设最初系统安装4个磁带驱动,而且随着系统应用的普及,系统资源的需求会随时间而增加。为了满足这种需求,有必要每年再增加4个磁带驱动,磁带驱动在3年后才到使用寿命。最后,磁带驱动的平均成本总是以一个“会计单元”来估计的。
并发访问的数量直接与磁带库中安装的磁带驱动的总数匹配。另外,图中指示了在某个时间点安装的是那一代磁带驱动的数量。上面描述的模型是基于这样的假设的,所安装的最新一代磁带驱动总能满足增长的需求,到达生命周期的单元用最新一代的驱动替换。
采用这种方法,系统随着需求的增长而成长,同时保持技术总是跟上最新的发展。由于对旧系统的支持容易随时间而变得昂贵,因此这种方式能最小化维护和支持成本。
为了评估这种永久重新投资方案中的成本,可应用上面所给的假设得出磁带驱动的平均成本。
基本上,迁移系统的不断升级支持了增长的需求,但会导致每年的固定投入。利用这种方法可以评估每年需要重新投资的费用,依此结果来计划财务资源。
7.5.2.5案例研究:在线系统
在线存储系统占了内容管理大规模存储系统大约一半的成本(即存储成本平均被分成在线和近线存储),它直接与在某个时间点所需的存储容量大致一起升级。为了做出随时间变化的在线存储成本的模型,假设在线存储系统是作为SAN的解决方案配置的。
为了简化,假设SAN的解决方案被分成某些子系统,称为SAN单元。一个SAN单元可以是一系列含有必要外设的磁盘。为了简化模型,假设只能增加或替换(更新比照,它只能由交换或添加磁盘来处理)完整的单元。另外,还要做出下面的假设:
·第一代SAN单元应该能够存储1TB。
·最初,系统应该使用其中一个SAN单元,因此它能在线存储1TB数据。
·由于这样配置的系统的需求会随时间的增加而变得越来越受欢迎,为了满足这种需求,每年增加1TB的存储容量是必要的。
·存储技术的发展意味着每2年就会有新一代的SAN单元提供2倍于以前的存储容量。
·一个SAN单元在3年后将达到生命周期。
·一个SAN单元,平均总是耗费一个“会计单元”,而与第几代无关。
随时间并发安装的SAN单元数量的一个总览,以及某一代SAN单元所需部署的指标。很明显(甚至与不断增加的需求比较),随着时间的变化系统的物理尺寸在减小,累计到一定时间后单元的数量会减到一个。这意味着,从长远看整个系统的复杂性会降低。这当然会对运行成本(总成本)产生积极的影响。
基本上,迁移方案(系统不断更新以支持增长的需求)导致每年固定量的投资。从长远来看,投资甚至可能减少。依据现实项目的情况,使用这种方法可以评估每年需重新投资的费用,并将结果用于计划财务资源。
7.5.2.6案例研究:浏览服务器
本章所描述的基准硬件体系结构利用分布式服务器来传送每个服务所需的资源到系统中。作为这种服务的一个例子,这一部分给出了对浏览服务器成本的案例研究。
浏览服务器所提供的服务是给一定数量的用户提供流媒体浏览质量的视频。依据浏览服务器的性能,每个服务器能处理一定数量的并发流。如果请求的处理多于一个服务器能处理的并发流(或有对某种水平冗余的需求),就必须安装附加的服务器。
为了做出浏览服务器随时间变化的成本模型,这里给出下面的假设:
·第一代服务器能处理高达50个并发流。
·最初,系统能支持50个并发流。
·不考虑冗余的选项。
·随着系统变得越来越受欢迎,对它的需求也随时间增加。为了满足不断增加的需求,每年增加性能以再支持50个并发流是很必要的。
·服务器和网络技术随时间不断提高,这意味着每2年就有新一代的服务器能够支持2倍于以前数量的流。
·一个服务器3年后达到生命周期。
·一个服务器,平均耗费一个“会计单元”,无论是哪一代的。
随时间变化的实际安装的服务器总量及在那个时间点不同代的服务器数量。该图表明了为了满足增长的需求和替换到达生命周期的单元所需部署的并发单元数量几乎是线性增长的。如果对所需求的线性增长做出假设(每年50个流),服务器服务质量水平每2年增加一倍(并发流50、100、200、400等),在某一点技术的进步将会超过需求的增长。
为了满足浏览服务器迁移环节的变化,每年所需的投资几乎是固定的投资额。从长远来看,投资甚至会减少。依据现实项目的情况,使用这种方法可以评估每年需重新投资的费用,并将结果用于计划财务资源。
上面所讨论的浏览服务器的模型,原理上对部署成服务器组的所有服务器都是有效的。因此,获得一个可估计的每年必要的投资来保持整个系统性能的提高以满足不断增长的需求是可能的。这对定义运行整个系统所需的年度预算会很有帮助。