• [Probabile OT]

    From Giuliano Grandin@21:1/5 to All on Thu Apr 13 17:50:01 2023
    Buona sera a tutti.
    Da un po' di tempo, ricevo da smartmontools un'email in locale per un
    problema a uno dei due SSD nvme, un Seagate FireCuda 520 SSD ZP1000GM30002
    da 1TB, dove ho la /home
    Questo è il contenuto del messaggio:

    The following warning/error was logged by the smartd daemon:
    Device: /dev/nvme1, number of Error Log entries increased from 690 to 692 Device info:
    Seagate FireCuda 520 SSD ZP1000GM30002, S/N:7QG02JSL, FW:STNSC016, 1.00 TB
    For details see host's SYSLOG.

    Ora, come si vede, il numero delle segnalazioni è piuttosto alto.

    L'SSD è stato installato a novembre del 2021 e, onestamente, non ho
    prestato particolare attenzione a quando sono cominciati i messaggi.
    L'altro SSD nvme, un Samsung 980 Pro che uso per la /, non ha mai dato
    segnali di questo tipo.
    In /var/log/syslog non noto nulla di particolare.
    Ho installato il pacchetto nvme-cli e col comando:
    nvme error-log /dev/nvme1
    trovo, nella parte iniziale dell'output, queste informazioni:

    Error Log Entries for device:nvme1 entries:63
    .................
    Entry[ 0]
    .................
    error_count : 694
    sqid : 0
    cmdid : 0x10
    status_field : 0x4004(INVALID_FIELD: A reserved coded value or an unsupported value in a defined field)
    parm_err_loc : 0x28
    lba : 0
    nsid : 0
    vs : 0
    trtype : The transport type is not indicated or the error is not transport related.
    cs : 0
    trtype_spec_info: 0


    Se capisco bene, a parte che le segnalazioni sono arrivate a 694, si tratta
    di errore da un codice riservato o invalido un certo campo.
    Ho cercato in internet, ma quello che ho trovato mi è incomprensibile.
    Uso una Debian Bullseye mista a testing (per avere kernel e qualcos'altro aggiornato).

    Magari qualcuno riesce ad aiutarmi a capire se quei messaggi indicano
    problemi seri oppure no?

    Grazie in anticipo
    Giuliano

    <div dir="ltr"><div>Buona sera a tutti.</div><div>Da un po&#39; di tempo, ricevo da smartmontools un&#39;email in locale per un problema a uno dei due SSD nvme, un Seagate FireCuda 520 SSD ZP1000GM30002 da 1TB, dove ho la /home</div><div>Questo è il
    contenuto del messaggio:<br></div><div><br></div><div>The following warning/error was logged by the smartd daemon:<br>Device: /dev/nvme1, number of Error Log entries increased from 690 to 692<br>Device info:<br>Seagate FireCuda 520 SSD ZP1000GM30002, S/N:
    7QG02JSL, FW:STNSC016, 1.00 TB</div><div>For details see host&#39;s SYSLOG.</div><div><br></div><div>Ora, come si vede, il numero delle segnalazioni è piuttosto alto.</div><div><br></div><div>L&#39;SSD è stato installato a novembre del 2021 e,
    onestamente, non ho prestato particolare attenzione a quando sono cominciati i messaggi.</div><div>L&#39;altro SSD nvme, un Samsung 980 Pro che uso per la /, non ha mai dato segnali di questo tipo.</div><div>In /var/log/syslog non noto nulla di
    particolare.</div><div>Ho installato il pacchetto nvme-cli e col comando:</div><div>nvme error-log /dev/nvme1</div><div>trovo, nella parte iniziale dell&#39;output, queste informazioni:</div><div><br></div><div>Error Log Entries for device:nvme1 entries:
    63<br>.................<br> Entry[ 0]   <br>.................<br>error_count     : 694<br>sqid            : 0<br>cmdid           : 0x10<br>status_field    : 0x4004(INVALID_FIELD: A reserved coded value or an unsupported value in a
    defined field)<br>parm_err_loc    : 0x28<br>lba             : 0<br>nsid            : 0<br>vs              : 0<br>trtype          : The transport type is not indicated or the error is not transport related.<br>cs            
     : 0<br>trtype_spec_info: 0</div><div><br></div><div><br></div><div>Se capisco bene, a parte che le segnalazioni sono arrivate a 694, si tratta di errore da un codice riservato o invalido un certo campo.</div><div>Ho cercato in internet, ma quello che
    ho trovato mi è incomprensibile.</div><div>Uso una Debian Bullseye mista a testing (per avere kernel e qualcos&#39;altro aggiornato).</div><div><br></div><div>Magari qualcuno riesce ad aiutarmi a capire se quei messaggi indicano problemi seri oppure no?<
    /div><div><br></div><div>Grazie in anticipo</div><div>Giuliano<br></div></div>

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)
  • From Marco Gaiarin@21:1/5 to All on Thu Apr 13 22:20:01 2023
    Mandi! Giuliano Grandin
    In chel di` si favelave...

    Magari qualcuno riesce ad aiutarmi a capire se quei messaggi indicano problemi seri oppure no?

    Non ritrovo il link, cito a memoria.


    'smartctl' ti dice che il drive 'è nel database'? Se no, siccome
    interpretando male alcuni dati può fare cavolate enormi, gli smartmontools
    si mettono in una modalità 'conservativa' e interpretano eslcuisvamente i
    dati di cui sono certi (a quanto capisco, le specifiche SMART sono un po'
    come i l codice della pirateria ne 'i pirati dei caraibi'... ;-).

    Quindi un dato che potrebbe essere 'normale' (stile un contatore che elenca
    i log inseriti, se questi non sono errori fatali) potrebbe essere un dato
    che incrementa 'normalmente' e non indica nulla relativamente al fallimento
    del disco.

    In questo caso devi identificare correttmente il parametro incriminato,
    e dire a smartd di 'ignorare gli incrementi', o magari segnalarti quando incrementa ma non segnalarti ogni giorno che è >0.


    FYI.

    --
    ...il ponte di Messina unirà «non due coste ma due cosche».
    (Niki Vendola)

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)