数据中心是数字基础设施的重要组成部分,同时也是一整套复杂的设施。它不仅仅包括计算机系统和其它与之配套的设备(例如通信和存储系统),还包含冗余的数据通信连接、环境控制系统、监控系统以及各种安全系统。运维管理又是数据中心在运营过程中历时最长的一个阶段。如何确保数据中心安全、可靠、高效的运行则是运维人员工作内容的重中之重。
在数据中心网络运维管理过程中,运维人员要对数据中心的网络构成、业务走向、设备相互连接关系等做充分的了解。据了解,现有的管理方式大多是将数据中心初建阶段的数据通过表格、图纸、文档等方式整理好,然后在以此为基础作为后续的变更规划,排障宝典。然而,事与愿违,实际工作中总会有不同的原因促使实施人员不按规范操作、数据变更不及时,重要文件丢失等,当遇到突发业务故障,手忙脚乱,翻遍表格、图纸,耗时耗力不说还影响客户对运维工作的满意度。
那么,既然现有管理方式并不是那么的有效,是否可以借助一些运维管理工具来完善我们的基础设施运维工作呢?
据了解,目前用于数据中心运维管理的工具有动环系统、监控系统、网管系统以及3D可视化系统,然而各个平台都是独立的,甚至不同品牌设备的管理系统也是独立的,运维人员日常维护需要登录多个系统,并且在其间来回切换。除此以外,以上都是针对有源设备开发的管理系统,然而往往造成系统故障的原因可能只是运维人员不小心碰掉了某根光跳线。可见仅仅只是管理硬件并不能解决根本问题。
“一只木桶盛水的多少,并不取决于桶壁上最高的那块木块,而恰恰取决于桶壁上最短的那块。”由此看来,高性能的设备可能会扩大计算、存储、分析以及灾备等能力,然而一根线缆的故障却能使其前功尽弃。由此可见,庞大的线缆管理难题始终都是数据中心运维管理这个木桶中最短的那块木块。
结合以上,小编认为有效的基础数据及线缆管理结合现有的有源设备管理系统,通过数据互通,相互补充汇总、进而分析报告,才能完善现有运维管理方式,使运维管理系统成为运维人员的股肱心腹。
基础数据包括:地理位置、园区范围、建筑外观、楼层机房数量、机房内部设备位置、机柜类型、机柜U位、设备外观、设备板卡、设备/板卡端口、线缆等。
管理方式:运用地图、图纸、图片等素材以层次化的方式建立图形可视化的网络基础设施数据库。
管理内容:地理位置、外观、名称编码、品牌、类型、数量、占用情况、线缆连接关系、端口流量、维护人员等等相关需要记录、管理的信息。
实现方法:可根据情况选择手动创建或通过插件使用Excel/WPS批量导入创建。
实现效果:
通过与第三方系统对接,运维管理人员可以全方位的了解整个数据中心基础设施的运行状态,快速处理日常业务需求及故障排除工作。
数据中心基础设施运维工作道阻且长,为响应国家号召“加快数字化发展,建设数字中国”。我们运维管理人员也要时刻保持创新,不能让“短板”拖累了我们紧随时代发展的步伐。
文:孟敏