Bonjour à tous,
J'ai une machine diskless (i9 10th gen. 20 threads, 64 Go de mémoire, swap sur iSCSI) que j'utilise avec Windowmaker (deux écrans). De temps
en temps, totalement aléatoirement, soit la session Windowmaker se
ferme, soit la machine s'arrête.
Ce soir, j'ai eu droit à un poweroff lorsque j'ai cliqué pour agrandir une icone !
Roberto C. Sánchez a écrit :
On Sat, Apr 02, 2022 at 07:32:03PM +0200, BERTRAND Joël wrote:
Bonjour à tous,Ça sonne comme une faute de mémoire. Tu devrais peut-être essayer memtest86+ pour voir. Si tu as le problème plus souvent quand la température (du CPU ou de la carte graphique) est plus haute, alors ça
J'ai une machine diskless (i9 10th gen. 20 threads, 64 Go de mémoire, >> swap sur iSCSI) que j'utilise avec Windowmaker (deux écrans). De temps
en temps, totalement aléatoirement, soit la session Windowmaker se
ferme, soit la machine s'arrête.
Ce soir, j'ai eu droit à un poweroff lorsque j'ai cliqué pour agrandir >> une icone !
peut être autre chose.
memtest86+ ne donne strictement rien. Dans le cas d'un faute mémoire, généralement, c'est plutôt un panic, là, c'est un arrêt propre, sans
aucune erreur.
Non.
Au début, je pensais que c'était lié à wdm (parce que la session se fermait aléatoirement et que je me retrouvait sur la page de connexion), depuis, j'ai remplacé wdm par lxdm avec le même problème. Je n'ai eu
qu'une seule fois un poweroff.
Je ne vois pas non plus comment windowmaker, même en ayant des vapeurs, pourrait initier une extinction propre d'une station. Un plantage de X
qui reviendrait à l'invite de wdm ou lxdm, oui, mais une fermeture
propre, je ne vois pas.
Je viens d'essayer de repasser un memtest86+ sur la machine en question (j'avais passé un tel outil lors des premiers plantages, mais de mémoire
à partir d'une clef USB) et j'ai un truc bizarre : après avoir chargé le binaire au travers de PXE, il me répond en boucle 0104. Je n'ai pas de
clef USB sous la main pour réitérer depuis une clef...
Roberto C. Sánchez a écrit :
Ce fil (en anglais) [0] indique que peut-être ton problème avec
memtest86+ est réglé avec changer le nom du binaire memtest86+ qui est servi au travers de PXE.
L'exécutable de memtest86+ (la dernière version que j'ai téléchargée sur le site officiel) se trouve dans le répertoire :
/srv/tftp/pxelinux.cfg.
J'ai renommé ce fichier en memtest86.bin (je ne sais pas trop comment est traité le signe + par PXE).
legendre# file memtest86.bin
memtest86.bin: DOS/MBR boot sector
J'ai donc bien un nom de fichier qui se termine par .bin. Le fichier est téléchargé sur le poste mais je n'obtiens que le cryptique 0104
Le fichier de boot est le suivant :
legendre# cat 01-d4-5d-64-b4-9a-3b
LABEL linux
KERNEL pxelinux.cfg/vmlinuz-hilbert
APPEND root=/dev/nfs initrd=pxelinux.cfg/initrd.img-hilbert nfsroot=192.168.10.128:/srv/hilbert ip=dhcp rw
LABEL memtest
KERNEL pxelinux.cfg/memtest86.bin
PROMPT 1
TIMEOUT 5
DEFAULT linux
legendre#
Je ne vois pas trop quelle erreur j'ai pu faire.
Je voudrais savoir si tu trouves quelque chose qui montre la source du problème.
Côté memtest ou côté arrêt de la machine ?
Sysop: | Keyop |
---|---|
Location: | Huddersfield, West Yorkshire, UK |
Users: | 293 |
Nodes: | 16 (2 / 14) |
Uptime: | 220:09:27 |
Calls: | 6,622 |
Calls today: | 4 |
Files: | 12,171 |
Messages: | 5,317,887 |