Преамбула:
Начиная с конца мая (когда в Москве началась жара) в нашей серверной началась "веселая жизнь". Несколько раз отключались кондиционеры, а в пятницу нам попытались ограничить потребление электроэнергии.
Приехали электрики, и заменили на входных фидерах вставки на 200 Aмпер на 100 Амперные. Пока все это происходило, естественно не работало освещение и кондиционеры, но расположенный в подвале УПС чесно тянул всю подключенную к нему вычтехнику - несколько сотен рабочих мест, полсотни серверов и два дестка цисок с АТС в придачу.
После того, как питание восстановилось, он начал заряжать батареи, при этом его потребление от сети зашкалило за 100A.
Приехала аварийка, заменили вставки (опять на такие же), после чего они сгорели снова. Это случилось уже в самом конце рабочего дня. Большинство персоналок выключили, остались только сервера, на которые УПС отдавал порядка 50A. Со скандалом заставили электриков вернуть все как было...
Амбула. В субботу упал сервер. По ТТХ аналог того, на чем сейчас крутится Ромба, только 2U и по-этому с рейдом.
Поднять его за выходные не получилось. Вчера приступил к выяснению отношений без скидок на ограничения выходных дней.
В минимальной конфигурации (т.е. с одним модулем памяти и без сетевухи), сервер завелся и дошел до инициализации рейд-контроллера, на которой и повис.
Я вспомнил, как в прошлом году сдох такой же контроллер у его брата-близнеца, и взяв диски, контроллер и кое-что по мелочи пошел к себе с мыслью пересадимть диски на набортовый SCSI контроллер, собрать на них SoftRaid и пусть дальше живет так. На всякий случай проверел контроллер на Cur DLS, на которой он и заработал.
После этого, я подключил к серверу другой БП и убедился, что виноват именно питальник. Причем, судя по всему, проблемы в цепи 3.3V, т.к. проявлялись они именно при подключении рейда, который практически не потребляет по 5V.
К сожалению БП у двухюнитовых корпусов нестандартный по геометрии, и вместо замены, пришлось заняться ремонтом.
По совету
ivp осмотрел конденсаторы, и обнаружил, что три из них вздулись. Заменил на позаимствованные с найденного на складбище Повермана IW-P300A2-0 3300 mkF Ost (спасибо всем, кто расписал в Вики, что такое хорошо и что такое плохо применительно к конденсаторам), после тестирования на машинке, которую не жалко и угробить, ежели что, поставил в сервер, который, опять-таки после тестирования вернул в стойку.
Да уж... Сделали толково. Спасибо за подсказку. Будем переваривать.
Опыт растет пропорционально выведенному из строя оборудованию.
Штирлиц стоял на своем. Это была любимая пытка Мюллера...
mr-plohish.mylivepage.ru
Отправить комментарий