数据中心预防性维护战略(ABB白皮书).pdf

ABB,pdf,数据中心,白皮书,预防性,设计资料
文档页数:14
文档大小:1.42MB
文档格式:pdf
文档分类:设计资料
上传会员:
上传日期:
最后更新:

数据中心预防性 维护策略 第124号白皮书 版本1 作者ThierryBayle 目录 >摘要 点击内容即可路转至具体章节 在加强数据中心成本控制和节约能源的讨论中,有时候 简介 2 忽视了数据中心物理基础设施预防性维护(PM)是控制 TCO和停机时间的重要工具.

预防性维护旨在预防故 PM结果 2 障发生.

通过更好地理解预防性维护的最佳操作方 PM的发展 3 法,IT经理和设备管理人员可提高系统运行时间.

本白 皮书介绍了有助于保障数据中心和IT设备间运行时间 PM发展的证据 4 的PM服务类型,并探讨了各种预防性维护方法和手 段,并给出了推荐的操作方法.

物理基础设施组件的故障原因 6 建议操作 7 PM方案 11 结论 13 资源 14 APC白皮书现收录于施耐德电气白皮书资料库 Schneider 由施耐德电气数据中心科研中心发表,
数据中心预防性维护策略 简介 本文重点介绍供电、制冷系统预防性维护(PM)的最佳实践,对PM实践方法(如:零部件更换、 校准)以及非操作性PM技术(如:热扫描和软件监控)进行了评估.

同时还探讨了更整体化、 减少以零部件导向的PM行业发展超势.

PM一词含义很广,根据数据中心的临界点涉及各种防范和避免问题的方法.

比如,状态基准维 “预防性维护”(也称“防范维护”)一词,指出现故障之前对潜在故障的系统检查和检测 护是通过概念公式评估停机风险,随时间推移评估和描绘设备状态的一种PM.

PM不能与针对非预测性问题或者处理紧急情况的临时维护混淆.

大多数情况下,PM包括更换 零件、断路器板热扫描、部件/系统调试、空气或水过滤器清洁、润滑或者物理基础设施固件 升级.

来讲,PM可以充当确保整个数据中心供电系统(发电机、转换开关,变压器、断路器和开关、 PDU和UPS)和制冷系统(CRAC.CRAH、加湿器,冷凝器和冷水机)的主要手段.

战略选择 2 实践 非侵入式 图1 数据中心 PM现状 预防 维护 计划 基于状态 战略方针 数据中心供电和制冷系统预防性维护(PM)策略要确保定期进行计划维护检查,并根据情况考虑 状态基准维护实践.

PM策略应该针对停机风险提供保护,同时避免出现延误或者检查和维护的 遗漏.

维护计划必须确保由经过充分培训并具有专业资质的维护专家对物理基础设施设备进行检 查(如:观察设备外观和性能变化以及设备工作声音的变化),执行必要的操作.

PM结果 PM检查期间可能会出现下列四种结果之一: 发现潜在问题并立即采取行动防止今后出现故障.

这是PM检查后最可能出现的结果.

发现新问题,并计划适当的维修.

这类检查应详细记录,以便服务提供商和数据中心 者可以将最近事件与过往的PM做对比,进行超势分析.

检查期间没有发现问题,并且在进行下次PM检查前没有出现停机.

设备具有生产商许可 和合格证明,在操作指导范围内能正常工作.

施耐德电气一数据中心科研中心 第124号白皮书版本12 2
数据中心预防性维护策略 在PM检查期间或者检查结束后立即发现缺陷,在尝试修复时出现了意外的停机(如:出 现了新问题).

当不合格人员进行维护时,出现不良结果的风险会显著增大,本文在后面会讨论降低与PM有关 的停机风险的方法.

PM的发展 对于60年代的数据中心,数据中心设备组件仅被视为一般性支持系统,按此标准接受维护.

当 时,数据中心充当核心业务的辅助工具,最重要的业务处理任务人工手动完成,数据中心者 方面的态度是“为什么要花钱搞维护?

”而生产商只对安装设备感兴趣,“修理设备”不是他们 关心的事.

随着时间的推移,计算机开始承担为数众多的重要商业任务,越来越多的公司开始将数据资产向 中心IT设备制造商们开始认识到主动维护计划有助于保障产品的作业性能.

这时出现了年度维护合同,许多数据中心者认识到了高水平服务带来的好处.

随着公司数据 日益成为多数公司的重要资产,对IT设备的合理维护开始成为支持关键业务程序可用性的必要 条件.

今天的PM概念,体现了从被动维修的心理(“坏了,修好”)发展到了一种主动的维护 要求(“检查设备,看看有什么危险的信号,在损环前将它修好”),从而最大程度地保证了全 年无间断使用的可能性.

物理基础设施架构变革的影响 与计算机维护相同,数据中心物理基础设施(如供电和制冷系统)的设备维护也随着时间的推移 不断进步.

在80年代,UPS的内部架构采用了100%独立组件设计,这些组件并没有从便于维 护维修的角度出发与设备内其他重要组件进行整合.

要实现预期可用性,这些UPS必须进行常 规维护,如:调整、紧固和清洁.

每次检查时每台UPS通常需要一名维护人员花上6-8个小 时对单个内部组件进行检查和调整.

在90年代,UPS的架构有了新的发展(参见图2),物理基础设施设备同时采用了单独维护组 件、整合组件和计算机化(数字化)组件,值此时期,一台典型的UPS只有50%的人工维护组 件,剩余的“内脏”是不需要连续维护的计算机化组件.

二十世纪八十年代 二十世纪九十年代 当前(2007) 2010及以后 传统UPS 计算机化的UPS 50% 图2 计算机化组件 合并 75% 计算机化细件 合并/ 90% UPS设计C以及相关PM的发 100% 计算机化组件 合并/ 展 拉立组件 50% 独立组件 25% 验立组件 10% 独立组件 内那元余 月度检查 季度检查 年度检查 供电和制冷系统的PM 转换为整个 预防性维护类型 施耐德电气一数据中心科研中心 第124号白皮书版本13 3
数据中心预防性维护策略 到90年代中期,UPS内的计算机化组件开始以输出信息的形式将内部运行状况通知给操作人员.

虽然PM检查仍需要按季度进行,但每次检查时维修人员对每台UPS检查的平均耗时变成了5 小时.

目前维护性组件与计算机化组件的比例已经进一步降到了25%的维护性组件和75%的计 算机化组件(参见图2).

今天,大多数数据中心现场每年仅需要进行一两次PM检查,但是如果物理基础设施设备处在不 良工作环境(如:高温、灰尘,污染和振动)中,可能需要进行更多的PM检查,检查频率取决 于实际环携和数据中心者的业务要求,组件的系统设计也可能影响PM的检查频率.

通常检 查次数取决于生产商的建议, PM发展的证据 与过去相比,如今的物理基础设施变得更加稳定,维护也更加方便.

生产商尽可能地对组件采取 了容错设计,以下是一些硬件设计改进的例子: 在传统背面检查通道之外,另提供侧面和正面内部组件检查通道的计算机机房空调 (CRACS) 可以控制内部风扇转速的冷却设备的变频驱动(VFD).

VFD解决了对传送带维护的要求 (传统上传送带有很高的维护要求) UPS的环绕式旁路功能可以解决PM检查期间IT停机问题 在硬件改进之外,对于基础设施的设计和架构也从支持PM的角度做出了调整,包括计划更为简 单,维护次数更少以及安全性更高.

例如: 允余冷却和电源设计可以实现并行维护,即使在维护期间也能对重要的IT负载提供保护 ) 免了因过多操作带案的电弧放电风险 近期对电弧放电风险的关注正在改变系统的设计思路,设计中尽量考虑避免PM人员在维 护期间发生触电事故 软件设计是重要的成功因素 物理基础设施硬件的设计只是降低PM成本和复杂程度的一个方首.

高效的物理基础设施管理软 件设计,作为实现高可用性的重要成功因素,其作用日益突出,卓越的数据中心充分利用且依赖 于物理基础设施管理软件.

通过自诊断功能,如果单个组件偏离了正常的工作温度范围,基础设施组件可以实现使用时间通 信和广播警告,并能在传感器检测到异常读数时给出提示,虽然目前还需要PM技术支持人员对 维护管理系统通信输出结果进行处理,但今后的发展方向将是一种具有完全自我修复功能的物理 基础设施系统.

施耐德电气一数据中心科研中心 第124号白皮书版本14
数据中心预防性维护策略 使用多种管理系统,每种系统仅针对各自的组件类型 管理系统之间很少存在或者根本没有通信: PM管理系统 “松散耦合的” 传统做法:组件型PM管理 PM管理 计算机机房 PDU 4 空调单元 断路器 UPS 加湿器 具有超前思维的数据中心者正在为整个数据中心电源系统规划一种综合性的PM策略,在目 前传统PM对现有设备支持仍唱主流的背景下,对将来设备维护的策骼应着眼于一种将数据中心 视为整体而非单个组件拼装结构(参见图3和图4).

通过从传统的组件型PM到完整供电系统或者完整的制冷循环冷却型PM做进一步的分析可以更 清楚的了解PM的发展进程.

以UPS(不间断电源)物理基础设施组件为例,当电源出现故障 时,通常并不一定是UPS出现了问题,原因也可能是断路器、开关或者电路问题.

因此提供一 种与这些重要组件进行绑定,并能以通信方式将数据返回给了解整个电源系统并能正确解释 系统消息的维护人员的监控系统,具有重要意义.

“完整的”PM组织 要对PM实现优化增效,数据中心者的内部组织架构应该进行相应调整,以满足高效实施综 合性和整合型PM操作方法的要求.

传统上IT和设施小组并没有很好地紧密配合,协调工作.

和维护.

由于这些系统目前已与数据中心建立了紧密耦合,因此需要考虑一种能实现两个小组关 键成员紧密合作的其他方法, 施耐德电气一数据中心科研中心 第124号白皮书版本15

资源链接请先登录(扫码可直接登录、免注册)
①本文档内容版权归属内容提供方。如果您对本资料有版权申诉,请及时联系我方进行处理(联系方式详见页脚)。
②由于网络或浏览器兼容性等问题导致下载失败,请加客服微信处理(详见下载弹窗提示),感谢理解。
③本资料由其他用户上传,本站不保证质量、数量等令人满意,若存在资料虚假不完整,请及时联系客服投诉处理。

投稿会员:匿名用户
我的头像

您必须才能评论!

手机扫码、免注册、直接登录

 注意:QQ登录支持手机端浏览器一键登录及扫码登录
微信仅支持手机扫码一键登录

账号密码登录(仅适用于原老用户)