On Sat, 11 Sept 2021 at 04:33, spied wrote:на материнской плате; или «битая» память.
Из моего опыта, чаще всего источником «непонятных» проблем является или нестабильное питание — умирающий БП или «вспухшие» конденсатор
БП может быть и не умирающий, а просто недостаточно мощный.
Ещё бывают глючные контроллеры SATA (или их драйвера). Не знаю,
насколько то применимо к SAS, но на одном сервере с PCIe SATA
контроллером опция ядра libata.force=noncq,8:3.0 (число перед ":3.0" в
другой конфигурации железа будет своё, а может и не одно) помогла
перевести один сыпавший ошибками BTRFS RAID1-массив, подключенный к
такому контроллеру, в состояние супер-стабильности. Причём ключевым
параметром стало ограничение скорости до SATA 3.0; noncq сам по себе
помог, но не до конца.
Кусок вывода lspci, чтобы в поиске всплывало: 01:00.0 USB controller: ASMedia Technology Inc. ASM1142 USB 3.1 Host Controller
02:00.0 PCI bridge: ASMedia Technology Inc. ASM1083/1085 PCIe to PCI
Bridge (rev 04)
05:00.0 SATA controller: ASMedia Technology Inc. ASM1062 Serial ATA Controller (rev 01)
On Sat, 11 Sept 2021 at 23:05, Артём Н. wrote:
Контроллер - маловероятно: работало же ранее.Как вариант, проблема могла вскрыться при изменившемся профиле
нагрузки и/или новой версии ядра.
Sysop: | Keyop |
---|---|
Location: | Huddersfield, West Yorkshire, UK |
Users: | 285 |
Nodes: | 16 (2 / 14) |
Uptime: | 78:03:54 |
Calls: | 6,489 |
Files: | 12,096 |
Messages: | 5,276,462 |