• Errors traduccions en =?utf-8?Q?catal?= =?utf-8?B?w6A=?= a Debian

    From Carles Pina i Estany@21:1/5 to All on Tue Jun 28 20:40:01 2022
    Hola,

    Escric molt poc per aquí però llegeixo força :-) alguns potser em
    coneixereu d'altres llocs de Debian / programari lliure.

    Ahir vaig obrir el "lxtask" i hi ha una cadena en català amb un error:
    "Tamany de la memòria virtual". "Tamany" no és correcte en català:
    hauria de ser mida, volum, grandària [1] o alguna altra cosa.

    Fa molts anys vaig aprendre'm aquesta i s'em va quedar molt fixat,
    encara recordo fa uns 20 anys quan m'ho van dir. Vaig quedar ben
    sorprès!

    Total, que vaig pensar en quants paquets a Debian tenen aquesta errada
    comuna ("tamany" enlloc de "mida"). N'he trobat almenys 18 (entre ells
    lxtask). Faré el mateix amb "sid" i enviaré correccions als paquets si
    és un número assumible.

    La meva pregunta: apart de "tamany" heu vist altres errades en
    traduccions català? Perquè ja que ho executo una altra vegada amb sid hi
    puc posar més paraules que siguin "errades segur".

    Què fa l'script?

    L'script es mira els ca.po de tots els paquets de Debian. Es podria
    passar un corrector però segur que hi ha moltes paraules que no coneix
    de les cadenes (noms de programes, autors, abreviacions, etc.). Una
    manera comuna de fer això és justament amb llistats de paraules que
    "estan malament segur". Per exemple ho fa el programa codespell-project
    [2] (ben explicat a [3]) o el mateix lintian de Debian [4].

    El tema és que els llistats aquest son en anglès així que si teniu
    paraules que heu vist malament a traduccions (com ara el meu "tamany") i
    m'ho envieu ho miro. I si apareixen moltíssims errors ja demanaria ajuda
    per enviar les correccions :-)

    A internet hi ha llistats d'errors comuns en català però normalment son
    més aviat expressions i no cadenes que apareixen a programes.

    En resum: si m'envieu paraules (en privat si voleu) que heu vist
    malament a les traduccions les buscaré i intentaré reportar o us diré on
    son si n'hi ha moltes (o ho poso a salsa.debian.org si volem repartir
    feina si n'hi haguès molta).

    Fins aviat!

    [1]: Optimot: https://aplicacions.llengua.gencat.cat/llc/AppJava/index.html?action=Principal&method=detall&input_cercar=tamany&numPagina=1&database=FITXES_PUB&idFont=8692&idHit=8692&tipusFont=Fitxes+de+l%27Optimot&numeroResultat=1&databases_avansada=&
    categories_avansada=&clickLink=detall&titol=Com+es+diu+tama%F1o+en+catal%E0%3F+%2F+%C9s+correcte+tamany+en+catal%E0%3F&tematica=&tipusCerca=cerca.fitxes

    [2]: https://github.com/codespell-project/codespell/blob/master/codespell_lib/data/dictionary.txt

    [3]: https://github.com/codespell-project/codespell

    [4]: https://salsa.debian.org/lintian/lintian/-/blob/master/data/spelling/corrections


    --
    Carles Pina i Estany
    https://carles.pina.cat

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)
  • From Carles Pina i Estany@21:1/5 to Aleix Vidal i Gaya on Tue Jun 28 21:20:01 2022
    Hola,

    On Jun/28/2022, Aleix Vidal i Gaya wrote:
    A Softcatalà tenim els informes de qualitat d'alguns projectes de traducció que justament analitzen aquest tipus d'errades, i d'altres.

    super!

    Els trobaràs a l'última columna de la taula que hi ha aquí: https://www.softcatala.org/recursos/memories/

    MOLT bona eina i molt ben presentada! No ho coneixia, gràcies!

    A l'informe de qualitat del projecte Debian hi surten uns quants "tamanys":

    https://static.softcatala.org/quality/debian.html

    guai! Posa debian però segons el fitxer debian-tm.po.zip em sembla que
    és només l'eina "apt". Jo ho he mirat a 32550 paquets (no tots tenen traducció al català, clar).

    Allà a l'enllaç (https://static.softcatala.org/quality/debian.html#TAMANY002a13e9-66b8-446d-b94d-fca2bdcd4c78)
    posa:

    ------
    Missatge: Paraula admesa només per alguns diccionaris.
    Suggeriments: mida; grandària; format; dimensió; proporció; volum
    ------

    Saps si hi ha el llistat de "paraules admeses només per alguns
    diccionaris" a algun lloc? He mirat a "Dades obertes" i no ho trobo (https://www.softcatala.org/dades-obertes/)

    I hi ha a Softcatalà algun llistat d'errors comuns disponible?

    Moltes gràcies! ja la memoria que has enviat és molt interessant :-)

    --
    Carles Pina i Estany
    https://carles.pina.cat

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)
  • From Ernest =?iso-8859-1?Q?Adrogu=E9?=@21:1/5 to All on Tue Jun 28 22:00:01 2022
    Hola,

    2022-06-28, 19:27 (+0100); Carles Pina i Estany escriu:
    [...]
    El tema és que els llistats aquest son en anglès així que si teniu
    paraules que heu vist malament a traduccions (com ara el meu "tamany") i
    m'ho envieu ho miro. I si apareixen moltíssims errors ja demanaria ajuda
    per enviar les correccions :-)

    Pots buscar un llistat de barbarismes, però en aquests llistats només
    trobaràs la forma canònica. Pensa que la morfologia de l'anglès és molt
    més simple que la del català. En català, la majoria d'adjectius tenen 4 formes, i els verbs més de 50. Cada cop que afegeixis una paraula al
    llistat hauries de generar totes les flexions possibles de la paraula
    (cosa gens trivial), si no corres el risc de no detectar l'errada.

    Per altra banda, aprofito per comentar que fa temps vaig fer unes
    simples modificaciones al meu Emacs, per afegir la funcionalitat de
    passar el corrector ortogràfic a les cadenes traduïdes dels fitxers PO.
    Si hi ha algú que utilitza el mode PO de l'Emacs i l'hi interessa, podeu
    trobar la configuració aquí:
    https://github.com/nfdisco/emacs.d#gettext-po-mode

    Salutacions

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)
  • From Carles Pina i Estany@21:1/5 to All on Tue Jun 28 23:00:01 2022
    Hola,

    On Jun/28/2022, Ernest Adrogué wrote:
    Hola,

    2022-06-28, 19:27 (+0100); Carles Pina i Estany escriu:
    [...]
    El tema és que els llistats aquest son en anglès així que si teniu paraules que heu vist malament a traduccions (com ara el meu "tamany") i m'ho envieu ho miro. I si apareixen moltíssims errors ja demanaria ajuda per enviar les correccions :-)

    Pots buscar un llistat de barbarismes, però en aquests llistats només trobaràs la forma canònica. Pensa que la morfologia de l'anglès és molt més simple que la del català. En català, la majoria d'adjectius tenen 4 formes, i els verbs més de 50. Cada cop que afegeixis una paraula al llistat hauries de generar totes les flexions possibles de la paraula
    (cosa gens trivial), si no corres el risc de no detectar l'errada.

    Tot i que "tamany" és un barbarisme no només penso en això sinó en
    errors d'escriptura comuns en català. En anglès hi ha llistats com ara: https://en.wikipedia.org/wiki/Commonly_misspelled_English_words

    O el que ha fet lintian d'afegir tots els errors que van trobant pensant
    que es poden repetir. (https://salsa.debian.org/lintian/lintian/-/blob/master/data/spelling/corrections)

    Indiquen errades comuns per allà dalt ("compatibility", "separate", and "similar") i no hi tenen "compabilities" per exemple.

    No cal detectar-ho tot, en millorar una mica (i passar-ho bé programant)
    doncs ja va bé :-)

    Quan trobi alguna cosa més informaré en aquest fil. I si els propers
    dies us adoneu d'errades de "typos" o barbarismes m'ho dieu i miro si
    apareixen més vegades... si hi és una poden ser-hi vàries.

    Si algú té interés (per passar un corrector a mà, buscar coses, etc.)
    puc fer un .tar.xz dels ca.po dels paquets i compartir-ho. Cap problema.

    Fins aviat,

    --
    Carles Pina i Estany
    https://carles.pina.cat

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)
  • From Carles Pina i Estany@21:1/5 to Carles Pina i Estany on Wed Jul 27 15:00:01 2022
    Hola,

    On Jun/28/2022, Carles Pina i Estany wrote:

    Quan trobi alguna cosa més informaré en aquest fil. I si els propers
    dies us adoneu d'errades de "typos" o barbarismes m'ho dieu i miro si apareixen més vegades... si hi és una poden ser-hi vàries.

    Vaig estar uns dies al vespre mirant aquest tema (fins que vaig tenir
    els vespres ocupats amb uns altres temes...).

    Amb el sistema "cutre" de baixar els *.po Catalans dels paquets de Debian
    vaig trobar "tamanys" que han estat corregits per:

    -vlc (notificat i corregit ràpid)
    -Django (vaig arreglar la traducció ja que és un projecte que faig
    servir)
    -Blender: la traducció està totalment desmontada :-( la història és interessant i està a https://developer.blender.org/T99798 . Bàsicament
    per motius diversos la traducció de Blender al català i altres idiomes
    està incorrecte

    En tinc algun altre pendent per enviar. El tema és quan son traduccions
    que no semblen mantingudes decidir qué fer.

    I vaig trobar altres errades a altre programari, reportat el que està i corregit.

    Les revisions ad-hoc de *.po i fer greps per errors possibles comuns han
    donat força bons resultats. Encara trobo a faltar llistats com els
    anglesos que vaig enviar. Això sí, mentre escrivia ara mateix he mirat algunes entrades d'aquí: https://git.progress-linux.org/packages/engywuck/libreoffice/tree/extras/source/autocorr/lang/ca/DocumentList.xml

    I sense buscar massa he trobat que hi ha 8 paquets que posa "l'icona"
    (enlloc de "la icona"):

    grep -l "l'icona" * | wc -l
    8

    El que es tarda més estona és en mirar l'última persona que ha fet la traducció, si està mantingut i enviar la suggerència :)

    Gràcies pels que em veu donar idees, SoftCatalà pels enllaços de dalt de paraules (Jordi Mas) i les memòries de traducció, etc.

    --
    Carles Pina i Estany
    https://carles.pina.cat

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)