Есть мамка Asus P5W-DH Deluxe (на экзотичном чипсете i975), использующаяся в домашнем файл-сервере. Из сокета выкушены ключи и в мамку вставлен Xeon 5160 (Socket 771), с разгоном мамки по FSB до 1333 (штатная частота для этого ксеона), снятие разгона проблем не решает.
Собственно, в чём проблемы:
1) При включении периодически (один раз из десяти где-то) не появляется одна из встроенных сетевух (там две Marvell Yukon II на борту), при этом если смотреть в dmesg и lspci (сервер работает под линуксом), то видно, что сетевухи якобы физически нет (не обнаруживается соответствующее PCI-устройство, т.е. проблема не с драйверами);
2) Время от времени начинают сыпаться ошибки при работе с дисками (от раза к разу с разными), мол bad CRC на SATA, после чего происходит повреждение RAID-Z и ZFS начинает его лечение. Кабели новые, кошерные, винты тоже беспроблемные;
3) Дополнительные симптомы: при интенсивной работе обоих сетевух (они объединены в виртуальную сетевуху 2GBps) в какой-то момент индикаторы на них гаснут и загораются спустя пару секунд, в логах ядра появляется сообщение о срабатывании сторожевого таймера сетевухи и дальше сеть ложится до ребута;
4) Дополнительные симптомы: в биосе выставлен автозапуск при подаче питания, но в реальности этого не происходит.
Конденсаторы - не дутые и на вид - нормальные. Немалая часть конденсаторов - с полимерным электролитом.
Куда копать? Таки выпаивать конденсаторы и мерять ёмкость? Смотреть осциллографом чИстоту питания мостов? Мрёт южный мост?
Из особенностей - на мамке стоит микросхема рейд-контроллера/SATA-разветвителя, но винты к ней не подключены.
Ещё один момент - с старыми планками памяти были ошибки в мемтесте, пытаясь побороть поднимал напряжение на памяти. Потом поменял планки, напряжение сейчас - нормальное. (Мысль - не поджарил-ли чего, поднимая напряжение). Но как память соотносится с глюками южного моста - не понимаю.
Отправить комментарий