2019年新冠肺炎疫情爆发至今已近三年,疫情扰乱了我们正常的工作生活秩序。整个2022年,两次新冠肺炎疫情严重影响了生活和生产秩序的有效进行,城市突然按下了“暂停键”。在过去的30天里,许多数据中心运维工程师经历了条件艰苦的“机房生活”。十几个人占了一个数据中心,甚至一个人在多个部门兼职。没有专门睡觉或者洗澡的地方,垫子和睡袋直接铺在过道里休息。
疫情防控形势严峻复杂,企业积极响应政府要求实施居家办公。面对瞬息万变的疫情,除了做好防护,还要做好准备和适应。

“作为运维从业者,一定要谈谈疫情给运维工作带来了哪些变化!”
01
疫情给运维带来的变化
首先,人员精简。疫情期间,为避免集群疫情,大部分数据中心采用AB轮班制,最大限度减少核心岗位或封闭办公和家庭协调,出勤率从原来的100%降低到50%,甚至不到10%。
其次,需求激增,公职、医疗、生活等各行各业都离不开“线上”,离不开网络。例如,6月2日,美团发布2022年第一季度业绩,外卖收入同比增长至242亿元。除去外卖小哥和商家,支撑数字的背后大概是大量的服务器和网络数据。对服务器计算、存储和网络资源的需求急剧上升。运维工程师不仅要维护数据中心的正常运行,还要提高可用性,为急需的网络和计算提供服务,对停电或极端天气事件等各种灾害有明确的应急预案。
在如此艰难的环境下,无论主备设备是否出现故障,这无疑给运维带来了前所未有的挑战,数据中心管理者压力巨大。我们迫切需要解决上述问题,精简人员是防疫的重要措施。所以只能考虑如何提高运维工程师的工作效率,运维工程师的精力是有限的,必须借助一些管理工具。
02
如何应对以上变化?
应急预案

视觉
网络基础设施管理软件可以远程查看机房的情况,网络部的同事可以通过工单通知现场运维部的同事,远程配合他们排查故障。
再者,nview网络基础设施管理平台以可视化的方式清晰记录设备与线缆、设备与设备之间的链路连接关系,将数据中心内的所有设备和线缆数据与对应的设备线缆关联起来,从而建立可视化数据库。包括但不限于纸质资料、图像资料、现场信息等。代替人工运维管理。
目前在日常运营中有了以上信息,知道哪些设备承载了关键业务,就可以实现关键业务保障和关键设备巡检,从而降低重大事故发生的概率,避免有限人力资源的浪费。
而且故障发生时有迹可循,跟踪到的信息很容易了解和掌握,利用已有数据和历史故障记录等信息快速排除障碍。在家办公的同事也可以通过VPN远程访问nVisual,了解数据中心的情况,配合高效处理,减少企业损失。
随着数据的增加,新的需求增加是必然的。当数据中心需要新设备上架时,nVisual内嵌的智能引导工具可以实现傻瓜式操作。人们只需要手动上架,规划其合理性、优化最短路径、配置线缆类型等工作都可以由软件代替。
以上措施可以提高有限的运维工程师在突发疫情情况下的工作效率,使他们能够将时间集中到有意义的保障工作上,而不是浪费在盲目关注和多部门沟通协调上。要知道,在金融行业,一旦出现故障,损失是以秒计算的。
长期计划

以上只是疫情爆发的临时保障措施。疫情肆虐时没有任何预警。企业唯一能做的就是提前做好准备,这样当意外情况从天而降时,才能保证业务的顺利、安全、稳定。
在数据中心的整个生命周期中,数据中心运维管理是最长的阶段。运维管理是数据中心保障业务的重中之重。过去,企业或数据中心管理者总是把这个重任期望在“人”身上,但人是不可控的、有限的,人与人之间存在差异,能力参差不齐。单纯依靠师傅的个人经验,还不如建立一个标准化、流程化的运维体系,将网络基础设施等有价值的资源数据记录在可控的服务器中。即使新的运维工程师在疫情期间在数据中心,当前数据中心情况不明确,也能通过历史数据和设备信息快速掌握数据中心资源信息,快速投入到自己的工作中,为企业带来价值。而不是企业为了“口碑”花费大量时间,占用老员工的工作时间。
随着互联网的发展和互联网应用的多样化,互联网数据规模呈指数级增长,对互联网数据中心的需求也将呈指数级增长。为满足当前互联网基础设施的需求,数据中心将不断扩展,数据中心的规模将不断上升,这对数据中心的建设规模、承载业务、存储和计算技术提出了更高的要求。我们不应该再用添加独立的excel表格的旧方法来管理我们的数据中心,这种方法很难维护。网络基础设施至少有数百个,有数千个端口和链路。这种人力策略可以保证excel和CAD图纸上数据的准确性三到五年,甚至十年以上。几十年了?要知道中国的通信技术日新月异,一个数据中心能投入使用的时间远远不止三五年。我相信在这次疫情中,很多运维工程师为了找故障点,检索信息等事情,挠头打电话到处跑。......
总结
目前一切生产生活都在平稳有序的恢复中,企业数据中心管理者千万不能掉以轻心,一定要从中吸取教训,防患于未然。数据中心事故基本都是“不发声,则一鸣惊人”,所以保证安全生产大有裨益,预防大于治疗。选择nVisual网络基础设施管理平台也有助于为企业的业务运营铸造一道“铜墙铁壁”。


