当时间的计划停机其实可以让你免遭损失。除非你绝对少不了,否则别信需要7*24、随时可用的服务这套论调。

问一下自己:当你宣布(或请求)停机窗口,以便完成升级或进行维护时,你那些用户会有啥反应?我想情况恐怕不妙。

多年前,在除了超大型IT部门外的所有环境,计划停机还是一件很平常的事;而如今,很少有企业轻易让你申请到很长的停机窗口。哪怕在凌晨时分这样的时间段,连明显不需要7*24服务的一些部门(比如三班倒的制造工厂或者设有急诊室的医院)都很难拒绝自己的用户访问数据。

其中的原因有多方面,但是说穿了还是日常业务过于依赖IT系统——而服务器虚拟化技术的出现,在很大程度上大大改进了规避灾难的能力。公司企业对数据入了迷、上了瘾;而技术取得了长足进展,以至于我们IT人士轻易就能满足他们这个“瘾”。

遗憾的是,这种情况带来了双重影响:它造就了一种氛围,即连针对计划停机再小的请求都常常被拒绝或被推迟;当灾难发生时,用户们毫无准备、束手无策。

停机的三个好处

首先,停机对于确保系统的稳健性和可靠性大有帮助。如果你得等上数周、乃至数月才能为基础架构打上重要补丁,这无异于自招麻烦。虽然现代化IT基础架构中的系统大多基本上不用停机就可以打上补丁,但是对于另一些系统而言,要打上最新版本,你就得关掉电源,因而给至少几个用户带来不便。

就拿你那些普通的交换机和路由器来说吧。它们常常一放就是好多年,顺畅无阻地运行。实际上,我在上一周碰到的一只桌面级汇聚交换机其正常运行时间超过了2000天。这足以那家厂商的产品确实很可靠,但是我可以打赌:这个设备的固件里面存在很大的安全漏洞——大得好几辆小车都能通过,很容易被人钻空子。

其次,如果能充分利用计划停机窗口,你就能检验高可用性功能、演练灾难恢复计划。要是你很少检验自己的高可用性或灾难恢复功能,那么当你真正需要这些功能时,它们失灵的可能性就要大得多。我在去年写过一篇博文,当时有位读者的留言可谓是一针见血:“任何功能要是每天使用不到一次,那么每当你使用它时,别指望它每次都行。你使用它的次数越少,当你实际使用时,它失灵的可能性就越大。”凭本人的经验,这句话再对不过了。

你知道自己的高可用性系统应该如何工作,但是你确信它们会正常工作吗?你有没有使用冗余交换机的光纤通道存储区域网(SAN)?有没有使用冗余的核心网络交换机或数据库集群?你是否让我可以不用提醒广大用户,就在工作时间段关闭其中一个系统呢?

如果你反对,这表明你根本就不够确信。只有在计划停机窗口期间有意关掉基础架构的冗余部分,你才能够确信自己的高可用性系统会按原本的方式正常工作。要不然,你就会搞清楚:要是自己有时间或预算,应该把精力主要投入在哪个环节,以求改进。

最后但可能也是最重要的一点是,计划停机让广大用户多多少少体会了万一真的发生灾难,会出现什么样的情况。在我亲眼目睹的几起非常严重的基础架构停运事件中,最糟糕的情况莫过于用户们一片茫然、不知所措。是的,关键业务系统的停运会影响生产力,这是完全可以料到的;但你会惊讶地发现,只要采取异常简单的措施,其实原本可以避免许多最严重的影响。要是你不偶尔关闭系统,看看会发生什么情况,也许永远也不知道那些措施。

据理力争

虽然给广大用户带来不必要的麻烦看起来像是没事找事,但是如果有充足的理由,关掉基础架构的一部分还是能给企业带来实实在在的好处。严酷的现实是,对计划停机请求坚决说不的企业终究会发现自己遭到非计划停机,由于灾难恢复机制未经考验,结果蒙受的损失要大得多,而广大用户对无法访问数据的日子又毫无准备。尽管据理力争让人不悦,但是下一次你的停机请求遭到反对时,你还是要竭力搬出这个理由。这么做也许不招人待见,但是总比不这么做要强得多。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2019-05-15 17:01:31
安全监控 容灾演练存在五种隐患,应如何发现和消除风险
容灾切换演练,是一项将管理与技术相互紧密结合系统工程,容灾系统能在紧急时刻保障业务连续性,但企业在容灾演练准备、容灾演练切换等过程中存在诸多隐患;如何发现隐患、 <详情>
2019-05-15 12:55:07
机房建设 做容灾,双活、多活、同城、异地、多云,到底应该怎么选?
不管怎么选择容灾方案,我们自己的业务系统,从自身架构上,一定要支持单元化,一定要支持数据同步才行,如果这都不支持,讲双活和多活,就是特么的扯淡。所以,打算搞双活 <详情>
2017-11-20 10:25:54
运维管理 三分钟掌握数据中心“容灾和备份的区别”
数据中心运行突发故障(如:天灾不可避免的灾难)是无法预测的,计算机里的数据就像扫雷游戏一样,十面埋伏充满雷区,随时都有可能Game Over,容灾备份就是数据安全的最后 <详情>
2017-01-16 10:31:59
数据中心节能 如何衡量数据中心的高可用性及容灾水平
数据中心的好与差有很多评判的方法,很多评价机构都是将多方面的因素考虑进来,对每种因素进行评分,再根据经验对每种因素给定权重,最终得出数据中心的评价结果,按照预先 <详情>
2016-07-28 10:30:40
项目招标 清远市税务局服务器扩容及应用层容灾采购项目招标
清远市中德招标有限公司受广东省清远市地方税务局的委托,对清远市地方税务局服务器扩容及应用层容灾采购项目进行公开招标采购,欢迎符合资格条件的供应商投标。 <详情>
从智能运维到智慧运营 擎创科技赋予企业“侦探”能力
2020-09-21 19:15:17
筑牢“新基建”的底座 中国移动(江苏常州)数据中心正式落户江苏中关村创智园
2020-09-21 17:42:22
国网信通产业集团呼伦贝尔大数据中心建成投运
2020-09-21 17:35:08
【IDC圈一周最HOT】IDCC2020、阿里全浸没式液冷数据中心、宝钢大数据中心、全国用云增119%、第33批CDN牌照
2020-09-21 17:30:33
网银互联LinkWAN出席中国(杭州)国际电子商务博览会
2020-09-21 17:17:44
将公共云延伸至本地,阿里云推出本地化部署服务云盒Cloud Box
2020-09-21 14:27:55
促进数据中心产业发展,华为一直在路上
2020-09-21 14:26:26
农业农村部:将推动建设农业农村大数据中心和平台
2020-09-21 13:15:38
第四届“强网杯” 全国网络安全挑战赛线下赛结果出炉,巅峰对决再现王者之争
2020-09-21 13:11:43
第四届“强网杯”创新作品赛圆满结束, 6组作品现场牵手成功
2020-09-21 13:02:02
万国数据上海三号数据中心完成绿色升级计划,以实际行动引领行业可持续发展
2020-09-21 12:58:54
北京5G用户首破500万大关 实现5G独立组网全覆盖
2020-09-21 11:26:59
顺应新基建浪潮,看超级大行360°玩转服务器智能运维
2020-09-21 10:58:04
腾讯:WeCom是企业微信海外版 和WeChat是不同产品
2020-09-21 10:55:24
湖北省拟投7731亿元推进新基建
2020-09-21 09:49:55