• ZFS e checksum error...

    From Marco Gaiarin@21:1/5 to All on Mon Mar 18 14:50:01 2024
    ZFS mi stupisce sempre... ad ogni modo, è colpa mia. Sono andato a ravanare
    in un server di backup per togliere un controller, ho sicuramente fatto
    casino con i cavi e ho allentato un connettore di alimentazione.


    Morale della favola, qualche giorno dopo tutti i dischi di un pool hanno iniziato a dare errori (fisici e logici).


    Ho spento il server, sistemato il cablaggio, fatto ripartire e ovviamente è partito il 'resilver' del pool, che ha già terminato due dischi e sta
    lavorando sugli altri due:

    zpool status -v rpool-backup

    pool: rpool-backup
    state: DEGRADED
    status: One or more devices is currently being resilvered. The pool will
    continue to function, possibly in a degraded state.
    action: Wait for the resilver to complete.
    scan: resilver in progress since Mon Mar 18 14:01:02 2024
    458G scanned at 294M/s, 84.4G issued at 54.1M/s, 13.5T total
    20.4G resilvered, 0.61% done, 3 days 00:15:17 to go
    config:

    NAME STATE READ WRITE CKSUM
    rpool-backup DEGRADED 0 0 0
    raidz1-0 DEGRADED 0 0 0
    ata-ST8000VN004-3CP101_WWZ1MBA8 DEGRADED 0 0 1.71K too many errors (resilvering)
    ata-ST8000VN004-3CP101_WWZ1Q7F1 DEGRADED 0 0 1.49K too many errors
    ata-ST8000VN004-3CP101_WRQ0WQ44 DEGRADED 0 0 1.54K too many errors
    ata-ST8000VN004-3CP101_WWZ1RFL5 ONLINE 0 0 3.06K (resilvering)
    cache
    scsi-33001438037cd8921 ONLINE 0 0 0

    la prima domanda è: TRE GIORNI?!?!


    la seconda domanda è: mi elenca una serie di file (una ventina) con errori permanenti e non risolvibili dal checksumming; ma come dicevo questo è un server di backup, non mi interessa:

    errors: Permanent errors have been detected in the following files:

    rpool-backup:<0x63f216>
    rpool-backup:<0x63f218>
    rpool-backup:<0x108d421>
    rpool-backup:<0x63ee2b>
    [...]
    /rpool-backup/vz/dump/vzdump-qemu-156-2024_03_16-23_53_30.vma.zst
    /rpool-backup/vz/dump/vzdump-lxc-125-2024_03_16-23_57_05.tar.zst


    ho provato ad eliminare qualche file, ma la riga è rimasta in quel modo:

    rpool-backup:<0x63f216>

    come posso dirgli: butta pure via i file corrotti e fregatene?


    Sto cercando dappertutto come fare, ma a parte fare un ripristino dei file,
    una ricosruzione del pool... non trovo info per una cosa che (io) reputo
    così semplice...


    Grazie.

    --
    Chi ha tagliato i ponti con la fantasia
    non si accorgera` di niente (E. Bennato)

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)
  • From Marco Gaiarin@21:1/5 to All on Tue Mar 19 22:20:03 2024
    come posso dirgli: butta pure via i file corrotti e fregatene?

    Mi rispondo da solo:

    zpool clear -F rpool-backup

    --
    Voi non ci crederete
    la mia ragazza sogna (R. Vecchioni)

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)
  • From Marco Gaiarin@21:1/5 to All on Tue Mar 19 23:20:01 2024
    come posso dirgli: butta pure via i file corrotti e fregatene?
    Mi rispondo da solo:
    zpool clear -F rpool-backup

    Col piffero, questo azzera gli errori ma non li corregge... basta uno scrub
    e tornano fuori...

    --
    I matti tutta la vita dentro la notte
    chiusi a chiave (F. De Gregori)

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)