数据中心UPS电源常见故障分析2
UPS作为数据中心不可或缺的电源保护设备,发挥着越来越重要的作用。但长期以来,部分用户不了解UPS的工作原理和技术特点,不重视UPS的管理和维护,缩短了其使用寿命,增加了故障率。因此,它会影响UPS的性能并导致UPS系统故障。UPS电源设备故障可分为运行故障和组件故障。
在产品出现故障的情况下,UPS供电设备的选择是关键的一步。这一步选择不好,首先会埋下隐患。UPS电源设备的连接和使用是第二个层次。有了好的设备,如果没有好的连接方案,就会有隐患。某电视台因为连接方案被厂家误导。几十个程序电源的UPS故障是连续的,大部分都是有惊无险,连续几年都是这样,让维护人员紧张又伤脑筋。方案是一个系统工程,不是维护人员能控制的。我没办法,只好请工厂工程师在重大活动和节日来值班。厂家的工程师在这里只能给用户心理安慰。
所谓运行故障,是指由于运维人员的误操作、对故障现象的错误判断、采取的措施和经验诊断不当而导致的故障。UPS的运行故障大致可分为知识故障、操作故障、延时故障、维护故障、经验故障、环境故障、突然停电等。
1、知识故障
(1)基本概念不清,容易被厂商误导。例如,高速公路竞标UPS要求UPS能够在一相或两相输入断开后继续供电,而不使电池放电。因为有的厂商标榜自己UPS的电池在输入断了之后不会放电,UPS还有50%的供电能力;两相输入后,电池仍不放电,UPS仍有25%的供电能力,延长了电池的使用寿命。用户认为这个性能不错,仔细分析也不难发现它的缺点:要想享受它的优点,必须购买4倍负载能力的UPS电源,否则一相断了就无法承载当前的负载。话说回来,UPS断了输入开关后面的两条线怎么办?到底会不会修?什么时候能修好?完全停电还能修吗?等等如何解决这一系列问题。如果用户真的按照负载的实际容量购买这样的UPS电源,这是一个很大的隐患,不是运维可以解决的。
(2)不便说明的原因。比如上个世纪就有用户开始用某国外品牌机。当时由于客观原因,虽然输入功率因数低,效率低,体积大,功耗高,价格贵,但无法解决,也不方便解决。现在已经出了比原来好很多的新款。例如,新型高频在线UPS比原有的工频在线UPS每年每100 kW节约5万度电,而容量为几兆瓦的机房每年可节约数百万度电。但不知什么原因,节能设备只是被遗漏,耗能机器仍写在标书里。这样做不安全,机器的结构特点也写在标书里。这不仅增加了空调设备的投资和占地面积,而且无疑为以后的运行埋下了隐患。这是运维中又一个无法解决的问题。