【 数码人白皮书1】从运维到运营–物联网如何帮助数据中心管理者走出困境?126
发表时间:2021-04-07 14:24 作者: 刘全 李晶晶 序言 数据中心运维管理是一项关键、枯燥、高重复性的工作。面对数据中心的高速发展,传统的运维管理方式正面临着人力成本高昂、管理手段落后、管理效率低下等困境。随着物联网和数字智能技术的逐渐成熟,我们发现:物联网和数字智能技术正在深刻改变数据中心现有的运维方式和运维流程,将彻底释放数据中心的所有潜能。 一、数据中心运维整体发展趋势分析 全球数据中心发展重心正从规模化建设向精细化运营转变。 随着亚马逊、微软、阿里、腾讯、华为、中国移动、中国电信等巨头的进入,国内云服务市场竞争加剧,各云服务商在市场拓展的同时会持续降低运营成本。 华为云&大数据产品线总裁马力在《智能运维,云数据中心运维的未来之路》一文中指出,未来的云数据中心运维必须:
由此可见,不管是从上层业务运行的实际需求来看,还是从数据中心运营商自身竞争的需要来看,更高的运维效率、更低的运营成本将是数据中心运维技术发展的最主要和最直接的驱动力。
二、数据中心运维技术发展的历史与现状 1、阻碍数据中心运维技术快速发展的历史原因 尽管数据中心的运维如此重要,但长期以来,相关运维的技术和手段仍然比较落后,“重建设,轻运维”成为行业普遍现状。甚至在很多人眼中,运维=酷炫的UI界面+超大拼接屏。 数据中心的运维,尤其是基础设施运维长期以来之所以未能得到大规模的普及,笔者分析主要以下原因:
除此之外,还有国内长期以来对软件价值的低估,用户需求不明确带来的设计变更附加成本等。正是因为以上这些原因,在大型云数据中心出现之前的“互联网1.0”时代,智能运维技术和实践一直未得到用户普遍的重视。
2、目前的现状:数据中心数字化、精细化、自动化运营已形成行业共识。 随着大型数据中心的增多,云计算相关技术的成熟,数据中心运维技术也日益受到大家的重视。 究其原因可以归纳如下:
这对IT硬件的影响主要有两方面:IT硬件的重要性下降(数据有备份),更换升级等操作更加频繁(坏了就换),在数据中心的全生命周期内,IT硬件资产管理的工作量大幅提升(同一U位可能不同时间段安装不同设备运行不同程序),依赖人工已经很难管理;
三、从“运维”到“运营”的观念转变,省钱才是硬道理 如上所述,数据中心的运维工作日益受到业界的重视,各种新技术也层出不穷,那么什么样的运维技术才是好技术,如何进行评判呢?笔者认为,只有真正能为用户创造价值的技术才能获得认可并实现规模化应用。换言之,能省钱(甚至赚钱)的技术就是好技术。 笔者认为,从运维(核心是可靠不出错)到运营(核心是可靠还省钱/赚钱)的变化,是在数据中心从“企业成本中心”向“企业生产中心”转变的过程中,运维人员必须经历的观念转变过程。 那么,什么样的数据中心才是好(可靠又省钱)的数据中心呢?抛开“风火水电”等基础设施的架构不谈,仅从运营的层面来看,笔者认为需要考虑以下问题: 1、资产盘点问题:资产繁多、管理复杂 数据中心涉及多种产品和设备,对运维人员技能要求较高。同时资产管理和盘点工作浪费运维人员大量时间,造成数据中心运维人力开支居高不下。 2、容量管理问题:管理粗放、盈利困难 对很多运营型数据中心来说,因规模较大,人工管理方式难以根据用户的设备数量、功耗、制冷等要求及时查询到合适的安装位置,造成业务不能及时上线,为企业带来重大损失。数据中心租赁市场竞争日趋激烈,粗放的管理模式造成运营成本过高,市场竞争力下降,侵蚀投资者利益。 3、故障定位问题:故障定位、维护困难 随着数据中心重要性的上升,由数据中心故障带来的企业损失也逐渐升高,所以故障恢复时间变得至关重要。但传统数据中心,采用人工管理方式,一旦出现故障需要花费大量时间进行排查(大型数据中心服务器规模高达数十万台)。运维人员80%时间都花费在定位故障上面,效率十分低下。 4、资产安全问题:U位级物理安全难以保障 因数据安全等因素,很多行业都对数据中心安全级别有严格要求。同时据Uptime报告显示,数据中心超过70%的故障是由于人为操作失误造成。所以对运维人员的分级、分区、分域授权至关重要。按空间划分,数据中心资产的物理安全等级可分为机房级、模块级(微模块)、机柜级、U位级。大多数的数据中心可以做到机房级物理安全(机房门禁),少部分可以做到机柜级物理安全(物理或电子门锁等形式)。只有极少数数据中心可以做到U位级的物理安全保障,在维护人员对机柜内部等某一台IT设备操作时及时给出安全告警信息。 图片来源:数码人U位资产物联方案 综上所述,可以总结出数据中心用户在运营层面的一些诉求:
四、物联网技术在数据中心的部分应用 笔者认为,相比AI、大数据等技术,物联网技术或许将首先在数据中心的运营工作中得到规模化应用。比如很多人都知道,谷歌的数据中心应用了神经网络等AI技术来实现能耗管理,但到底是如何实现的,效果如何,能否推广,却鲜有资料流出。不可否认,大型高科技公司和互联网公司本身技术和人才积累雄厚,可以在AI、大数据等方面进行尝试和创新应用。但对大多数的数据中心用户来说,物联网技术可能会更早成熟并进入实际应用阶段。 据了解,目前一些数据中心,已经将物联网应用纳入到下一代数据中心规划中。不少基于数据中心的物联网技术也已经进入规模化应用阶段,具体来看,主要有以下几个方面: 物联网在资产安全方面的应用:
图片来源:腾讯T-block U位智能管理
物联网在容量和能耗方面的应用:
图片来源:某机房资源可视化管理视图
物联网在自动化运维方面的应用:
结语 除了上述功能之外,利用物联网技术还可以实现诸多功能,这里不做一一赘述。笔者也希望未来有更多的新技术能在数据中心领域得到实际应用,希望更多的厂家和技术人员为实现数据中心高效、数字化、自动化、精细化运营作出贡献。 |