• Errore in dmesg di "task kworker"

    From Leandro Noferini@21:1/5 to All on Mon Aug 28 07:30:01 2023
    Ciao a tutti,

    debian installata su raspberry 4 con sistema operativo su schedina sd ma
    con tutte le varie directory in scrittura (home, var, opt) montate su
    disco esterno.

    Oggi mi sono trovato questo errore ripetuto più volte con tempi diversi
    nel dmesg:

    [3730483.156140] INFO: task kworker/0:2:32752 blocked for more than 120 seconds.
    [3730483.156178] Tainted: G C 6.1.21-v8+ #1642 [3730483.156184] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
    [3730483.156190] task:kworker/0:2 state:D stack:0 pid:32752 ppid:2 flags:0x00000008
    [3730483.156210] Workqueue: events_freezable mmc_rescan
    [3730483.156233] Call trace:
    [3730483.156237] __switch_to+0xf8/0x1e0
    [3730483.156252] __schedule+0x2a8/0x830
    [3730483.156260] schedule+0x60/0x100
    [3730483.156269] __mmc_claim_host+0xbc/0x208
    [3730483.156276] mmc_get_card+0x3c/0x50
    [3730483.156283] mmc_sd_detect+0x28/0x98
    [3730483.156290] mmc_rescan+0xa0/0x2c8
    [3730483.156297] process_one_work+0x208/0x480
    [3730483.156307] worker_thread+0x50/0x428
    [3730483.156315] kthread+0xfc/0x110
    [3730483.156323] ret_from_fork+0x10/0x20

    Mi dovrei preoccupare?

    --
    Ciao
    leandro

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)
  • From Giancarlo Martini@21:1/5 to All on Mon Aug 28 09:30:01 2023
    sei riuscito a vedere a chi appartengono ?
    pid:32752 ppid:2


    Il giorno lun 28 ago 2023 alle ore 07:23 Leandro Noferini < lnoferin@cybervalley.org> ha scritto:

    Ciao a tutti,

    debian installata su raspberry 4 con sistema operativo su schedina sd ma
    con tutte le varie directory in scrittura (home, var, opt) montate su
    disco esterno.

    Oggi mi sono trovato questo errore ripetuto più volte con tempi diversi
    nel dmesg:

    [3730483.156140] INFO: task kworker/0:2:32752 blocked for more than 120 seconds.
    [3730483.156178] Tainted: G C 6.1.21-v8+ #1642 [3730483.156184] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs"
    disables this message.
    [3730483.156190] task:kworker/0:2 state:D stack:0 pid:32752
    ppid:2 flags:0x00000008
    [3730483.156210] Workqueue: events_freezable mmc_rescan
    [3730483.156233] Call trace:
    [3730483.156237] __switch_to+0xf8/0x1e0
    [3730483.156252] __schedule+0x2a8/0x830
    [3730483.156260] schedule+0x60/0x100
    [3730483.156269] __mmc_claim_host+0xbc/0x208
    [3730483.156276] mmc_get_card+0x3c/0x50
    [3730483.156283] mmc_sd_detect+0x28/0x98
    [3730483.156290] mmc_rescan+0xa0/0x2c8
    [3730483.156297] process_one_work+0x208/0x480
    [3730483.156307] worker_thread+0x50/0x428
    [3730483.156315] kthread+0xfc/0x110
    [3730483.156323] ret_from_fork+0x10/0x20

    Mi dovrei preoccupare?

    --
    Ciao
    leandro



    --
    Giancarlo Martini
    (Replace 'AAA' con '@')
    mailto:giancarlo.firAAAgmail.com <giancarlomartiniAAAgmail.com>

    <div dir="ltr">sei riuscito a vedere a chi appartengono ?<div> pid:32752 ppid:2</div><div> <br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">Il giorno lun 28 ago 2023 alle ore 07:23 Leandro Noferini &lt;<a href="mailto:
    lnoferin@cybervalley.org">lnoferin@cybervalley.org</a>&gt; ha scritto:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">Ciao a tutti,<br>

    debian installata su raspberry 4 con sistema operativo su schedina sd ma<br> con tutte le varie directory in scrittura (home, var, opt) montate su<br>
    disco esterno.<br>

    Oggi mi sono trovato questo errore ripetuto più volte con tempi diversi<br> nel dmesg:<br>

    [3730483.156140] INFO: task kworker/0:2:32752 blocked for more than 120 seconds.<br>
    [3730483.156178]       Tainted: G         C        Â
  • From Leandro Noferini@21:1/5 to Giancarlo Martini on Mon Aug 28 21:40:01 2023
    Giancarlo Martini <giancarlo.fir@gmail.com> writes:

    sei riuscito a vedere a chi appartengono ?
    pid:32752 ppid:2

    No, è un server remoto e non ce l'ho sotto mano se non da remoto per l'appunto.

    [...]

    Non sarà che si sta scassando la SD?

    Comunque per ora non vedo più niente del genere.

    --
    Ciao
    leandro

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)
  • From Leandro Noferini@21:1/5 to Diego Zuccato on Mon Aug 28 21:30:01 2023
    Diego Zuccato <diego.zuccato@unibo.it> writes:

    E' da un po' che non uso il RPi, ma mi verrebbe da dire che è un problema di SD
    lenta. Classe 10 A2 ?

    Cosa hai caricato per "inquinare" il kernel? :)

    Non ne ho idea: il computer è un piccolo server con yunohost e non mi
    pare di aver visto mai niente del genere.

    --
    Ciao
    leandro

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)
  • From Giancarlo Martini@21:1/5 to All on Tue Aug 29 09:40:02 2023
    A leggere l'errore mi sembrava di aver capito che un processo è andato in timeout dopo 120 sec. I problemi che ho avuto con le sd si manifestavano
    subito con errori palesi dei programmi che provavano a scrivere o
    a leggere.
    Scusa Leandro, forse ho capito male io il senso del messaggio, ma se puoi
    dare il comando dmesg, da remoto, non puoi dare il comando ps aux |grep
    32752?


    --
    Giancarlo Martini
    http://www.giancarlomartini.it
    http://www.linkedin.com/in/giancarlo-martini

    Il lun 28 ago 2023, 21:33 Leandro Noferini <lnoferin@cybervalley.org> ha scritto:

    Giancarlo Martini <giancarlo.fir@gmail.com> writes:

    sei riuscito a vedere a chi appartengono ?
    pid:32752 ppid:2

    No, è un server remoto e non ce l'ho sotto mano se non da remoto per l'appunto.

    [...]

    Non sarà che si sta scassando la SD?

    Comunque per ora non vedo più niente del genere.

    --
    Ciao
    leandro



    <div dir="ltr"><div dir="auto">A leggere l&#39;errore mi sembrava di aver capito che un processo è andato in timeout dopo 120 sec. I problemi che ho avuto con le sd si manifestavano subito con errori palesi dei programmi che provavano a scrivere o a 
    leggere. </div><div dir="auto">Scusa Leandro, forse ho capito male io il senso del messaggio, ma se puoi dare il comando dmesg, da remoto, non puoi dare il comando ps aux |grep 32752?</div><div dir="auto"><br><br><div data-smartmail="gmail_signature">--<
    Giancarlo Martini<br><a href="http://www.giancarlomartini.it" target="_blank">http://www.giancarlomartini.it</a><br><a href="http://www.linkedin.com/in/giancarlo-martini" target="_blank">http://www.linkedin.com/in/giancarlo-martini</a></div></div></
    <br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">Il lun 28 ago 2023, 21:33 Leandro Noferini &lt;<a href="mailto:lnoferin@cybervalley.org" target="_blank">lnoferin@cybervalley.org</a>&gt; ha scritto:<br></div><blockquote class="gmail_
    quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">Giancarlo Martini &lt;<a href="mailto:giancarlo.fir@gmail.com" rel="noreferrer" target="_blank">giancarlo.fir@gmail.com</a>&gt; writes:<br>

    &gt; sei riuscito a vedere a chi appartengono ?<br>
    &gt;  pid:32752 ppid:2<br>

    No, è un server remoto e non ce l&#39;ho sotto mano se non da remoto per<br> l&#39;appunto.<br>

    [...]<br>

    Non sarà che si sta scassando la SD?<br>

    Comunque per ora non vedo più niente del genere.<br>

    --<br>
    Ciao<br>
    leandro<br>

    </blockquote></div>

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)
  • From Marco Gaiarin@21:1/5 to All on Tue Aug 29 16:50:02 2023
    Mandi! Leandro Noferini
    In chel di` si favelave...

    Non sarà che si sta scassando la SD?

    AFAIk no, gli errori sono diversi; anche se mi par di ricordare che le SD
    non hanno alcun sistema di monitoraggio ala-SMART, quindi muoiono di botto e basta.

    Gli errori che vedi sono segnalazioni del kernel che è 'piantato' a fare qualcosa che ci mette molto più del tempo necessario e normale; possono
    essere benigni, se hai uno storage lento o con bassi IOPS ('che fa poche
    cose per volta').

    --
    L'unico metodo naturale per arrestare la caduta dei capelli
    e` il pavimento. (Marco d'Itri)

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)
  • From Leandro Noferini@21:1/5 to Marco Gaiarin on Wed Aug 30 10:10:01 2023
    Marco Gaiarin <gaio@lilliput.linux.it> writes:

    Mandi! Leandro Noferini
    In chel di` si favelave...

    Non sarà che si sta scassando la SD?

    AFAIk no, gli errori sono diversi; anche se mi par di ricordare che le SD
    non hanno alcun sistema di monitoraggio ala-SMART, quindi muoiono di botto e basta.

    Non me lo dire....

    :)

    Gli errori che vedi sono segnalazioni del kernel che è 'piantato' a fare qualcosa che ci mette molto più del tempo necessario e normale; possono essere benigni, se hai uno storage lento o con bassi IOPS ('che fa poche
    cose per volta').

    Sicuramente ne fa poche.

    Speriamo sia quello.

    --
    Ciao
    leandro

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)
  • From Leandro Noferini@21:1/5 to Giancarlo Martini on Wed Aug 30 10:10:01 2023
    Giancarlo Martini <giancarlo.fir@gmail.com> writes:

    A leggere l'errore mi sembrava di aver capito che un processo è andato
    in timeout dopo 120 sec. I problemi che ho avuto con le sd si
    manifestavano subito con errori palesi dei programmi che provavano a
    scrivere o a leggere.

    Capito.

    Scusa Leandro, forse ho capito male io il senso del messaggio, ma se
    puoi dare il comando dmesg, da remoto, non puoi dare il comando ps aux
    |grep 32752?

    Hai ragione, mi sono spiegato male: il fatto è che non controllo
    continuamente il server in oggetto e quindi quando sono andato a
    controllare il dmesg e quindi a cercare il programma che era indicato
    questo era già finito perché il comando che dici te non mi ha riportato niente.

    Grazie un monte!

    --
    Ciao
    leandro

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)
  • From Alessandro Rubini@21:1/5 to All on Wed Aug 30 10:40:01 2023
    le SD non hanno alcun sistema di monitoraggio ala-SMART, quindi
    muoiono di botto e basta.

    In realta` alcuni vendo qualcosa offrono. Ho un cliente che usa una
    libreria del vendor sulle eMMC dei suoi impianti sul territorio.
    Ovviamente roba del vendor, fatta male e secretata. Non ne so altro
    per ora, e quando lo sapro` non portro` piu` parlarne.

    Comunque la memoria a stato solido e` una brutta bestia, una volta il
    cliente imputava un baco nel mio buildroot, mesi dopo e` uscito che
    era un baco firmware nella chiavetta usb. C'e` un processore la`
    sotto, e non sappiamo quello che fa.

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)
  • From Alessandro Rubini@21:1/5 to All on Wed Aug 30 11:10:02 2023
    Riparto dal messaggio originale. E` un po' che non metto mano in queste
    cose quindi non volevo dire bestialita`, ma ho visto degli errori in
    alcune altre risposte.

    Prima di tutto, no, questa volta non dico sia colpa di systemd :)

    [3730483.156140]

    Questo e` il tempo dall'accensione, in secondi. 43.17 giorni. Il
    sistema internamente non usa il tempo esterno perche` non e`
    affidabile (se l'utente o ntp cambia l'ora che succede?)


    INFO: task kworker/0:2:32752 blocked for more than 120 seconds.

    Dopo dice "task:kworker/0:2" a conferma che 32752 e` il pid
    di kworker/0:2 . Quindi fare "ps" e` inutile.

    Non e` "andato in timeout", espressione che indica il fallimento di
    qualcosa. Ci ha messo piu` di 120 secondi a fare quello che doveva
    fare. Se il messaggio e` per 120 secondi, e non 120ms, vuol dire che
    e` abbastanza normale che ci metta un po'.

    "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.

    Cercherei in rete o nei sorgenti "hung_task_timeout_secs", sapendo che
    la prima fonte e` piena di falsi. Sono fuori sede e non ho un
    linux.git sotto mano, ma prima o poi ci guardo per curiosita` mia.

    [3730483.156210] Workqueue: events_freezable mmc_rescan

    Questa e` la coda di cose da fare per questo processo. Quindi immagino
    stia facendo mmc_rescan, che potrebbe essere un'operazione lunga, in particolare se la memoria e` in uso (quindi l'I/O di rescan va
    intercalato con gli altri I/O). Ma non so cosa sia mmc_rescan, va
    controllato.

    [3730483.156233] Call trace:
    [3730483.156237] __switch_to+0xf8/0x1e0
    [3730483.156252] __schedule+0x2a8/0x830
    [3730483.156260] schedule+0x60/0x100

    Qui si vede che il messaggio avviene durante un cambio di contesto
    (switch_to, schedule), quindi non e` detto che quanto sta nello stack
    trace sia significativo. Su un'altra macchina mi capita spesso e lo
    stack trace non ha relazione col baco che genera il ritardo.

    [3730483.156269] __mmc_claim_host+0xbc/0x208
    [3730483.156276] mmc_get_card+0x3c/0x50
    [3730483.156283] mmc_sd_detect+0x28/0x98
    [3730483.156290] mmc_rescan+0xa0/0x2c8
    [3730483.156297] process_one_work+0x208/0x480
    [3730483.156307] worker_thread+0x50/0x428

    In realta` sembra che la cosa sia significativa. Il processo che
    subisce schedulazione sta facendo mmc_rescan (e non ha schedulato per
    piu` di 120 secondi: non ci dice quanto perche` non e` ancora
    successo). Andrebbe verificato cosa sia questa cosa. Non e` che la macchina
    ha un secondo slot sd, non popolato, che viene erronemaente rilevato
    per un bogone sul segnale di presenza ("card inserted")?

    Comunque non e` nulla di fatale, tanto che si puo` disabilitare il
    messaggio. Certo, la sdcard non e` eterna, in particolare se ci si
    scrive molto.

    Mi dovrei preoccupare?

    Il giusto, non di piu` non di meno.

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)