• Re: Fermetures =?iso-8859-1?Q?intempestive?= =?iso-8859-1?Q?s_de_sessio

    From Roberto =?iso-8859-1?Q?C=2E_S=E1nch@21:1/5 to All on Sun Apr 3 22:00:01 2022
    On Sat, Apr 02, 2022 at 07:32:03PM +0200, BERTRAND Joël wrote:
    Bonjour à tous,

    J'ai une machine diskless (i9 10th gen. 20 threads, 64 Go de mémoire, swap sur iSCSI) que j'utilise avec Windowmaker (deux écrans). De temps
    en temps, totalement aléatoirement, soit la session Windowmaker se
    ferme, soit la machine s'arrête.

    Ce soir, j'ai eu droit à un poweroff lorsque j'ai cliqué pour agrandir une icone !

    Ça sonne comme une faute de mémoire. Tu devrais peut-être essayer
    memtest86+ pour voir. Si tu as le problème plus souvent quand la
    température (du CPU ou de la carte graphique) est plus haute, alors ça
    peut être autre chose.

    Salut,

    -Roberto

    --
    Roberto C. Sánchez

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)
  • From Roberto =?iso-8859-1?Q?C=2E_S=E1nch@21:1/5 to All on Mon Apr 4 17:50:01 2022
    On Mon, Apr 04, 2022 at 09:40:39AM +0200, BERTRAND Joël wrote:
    Roberto C. Sánchez a écrit :
    On Sat, Apr 02, 2022 at 07:32:03PM +0200, BERTRAND Joël wrote:
    Bonjour à tous,

    J'ai une machine diskless (i9 10th gen. 20 threads, 64 Go de mémoire, >> swap sur iSCSI) que j'utilise avec Windowmaker (deux écrans). De temps
    en temps, totalement aléatoirement, soit la session Windowmaker se
    ferme, soit la machine s'arrête.

    Ce soir, j'ai eu droit à un poweroff lorsque j'ai cliqué pour agrandir >> une icone !

    Ça sonne comme une faute de mémoire. Tu devrais peut-être essayer memtest86+ pour voir. Si tu as le problème plus souvent quand la température (du CPU ou de la carte graphique) est plus haute, alors ça
    peut être autre chose.

    memtest86+ ne donne strictement rien. Dans le cas d'un faute mémoire, généralement, c'est plutôt un panic, là, c'est un arrêt propre, sans
    aucune erreur.

    Tu utilises un bureau autre que Windowmaker sur la même machine ?

    Salut,

    -Roberto

    --
    Roberto C. Sánchez

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)
  • From Roberto =?iso-8859-1?Q?C=2E_S=E1nch@21:1/5 to All on Mon Apr 4 21:00:01 2022
    On Mon, Apr 04, 2022 at 06:04:18PM +0200, BERTRAND Joël wrote:

    Non.

    Au début, je pensais que c'était lié à wdm (parce que la session se fermait aléatoirement et que je me retrouvait sur la page de connexion), depuis, j'ai remplacé wdm par lxdm avec le même problème. Je n'ai eu
    qu'une seule fois un poweroff.

    Je ne vois pas non plus comment windowmaker, même en ayant des vapeurs, pourrait initier une extinction propre d'une station. Un plantage de X
    qui reviendrait à l'invite de wdm ou lxdm, oui, mais une fermeture
    propre, je ne vois pas.

    Je viens d'essayer de repasser un memtest86+ sur la machine en question (j'avais passé un tel outil lors des premiers plantages, mais de mémoire
    à partir d'une clef USB) et j'ai un truc bizarre : après avoir chargé le binaire au travers de PXE, il me répond en boucle 0104. Je n'ai pas de
    clef USB sous la main pour réitérer depuis une clef...

    C'est un truc très bizarre. Je ne sais pas en quoi memtest86+ chargé de
    PXE c'est différent de memtest86+ chargé d'une clef. Je m'imagine que
    c'est le même.

    Ce fil (en anglais) [0] indique que peut-être ton problème avec
    memtest86+ est réglé avec changer le nom du binaire memtest86+ qui est
    servi au travers de PXE.

    Je voudrais savoir si tu trouves quelque chose qui montre la source du problème.

    Salut,

    -Roberto

    [0] https://stackoverflow.com/questions/54939557/booting-memtest86-from-usb-stick

    --
    Roberto C. Sánchez

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)
  • From Roberto =?iso-8859-1?Q?C=2E_S=E1nch@21:1/5 to All on Tue Apr 5 02:40:01 2022
    On Mon, Apr 04, 2022 at 11:09:52PM +0200, BERTRAND Joël wrote:
    Roberto C. Sánchez a écrit :

    Ce fil (en anglais) [0] indique que peut-être ton problème avec
    memtest86+ est réglé avec changer le nom du binaire memtest86+ qui est servi au travers de PXE.

    L'exécutable de memtest86+ (la dernière version que j'ai téléchargée sur le site officiel) se trouve dans le répertoire :
    /srv/tftp/pxelinux.cfg.

    J'ai renommé ce fichier en memtest86.bin (je ne sais pas trop comment est traité le signe + par PXE).

    legendre# file memtest86.bin
    memtest86.bin: DOS/MBR boot sector

    J'ai donc bien un nom de fichier qui se termine par .bin. Le fichier est téléchargé sur le poste mais je n'obtiens que le cryptique 0104

    Le fichier de boot est le suivant :
    legendre# cat 01-d4-5d-64-b4-9a-3b
    LABEL linux
    KERNEL pxelinux.cfg/vmlinuz-hilbert
    APPEND root=/dev/nfs initrd=pxelinux.cfg/initrd.img-hilbert nfsroot=192.168.10.128:/srv/hilbert ip=dhcp rw

    LABEL memtest
    KERNEL pxelinux.cfg/memtest86.bin

    PROMPT 1
    TIMEOUT 5
    DEFAULT linux
    legendre#

    Je ne vois pas trop quelle erreur j'ai pu faire.

    Tout me semble bien. Je ne sais pas quoi d'autre tu peux faire.

    Je voudrais savoir si tu trouves quelque chose qui montre la source du problème.

    Côté memtest ou côté arrêt de la machine ?

    Plus bien du côté de la machine, mais les deux m'intéressent.

    Salut,

    -Roberto

    --
    Roberto C. Sánchez

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)