• vim und Rechtschreibung

    From Christoph Brinkhaus@21:1/5 to All on Thu Oct 10 19:20:01 2024
    Hallo Mitübersetzer,
    der Editor vim bietet eine Überprüfung der Rechtschreibung an.
    Mir sind dabei in letzter Zeit viele Fehler durch gerutscht.
    Dabei waren es hauptsächlich Worte wie "standardmäßig", die
    mit »ß« geschrieben werden, die die Korrektur aber auch in der
    falschen Schreibweise mit »ss« nicht moniert hat.

    Standardmäßig wird für deutsche Texte in UTF-8-Kodierung
    die Datei »~/.vim/spell/de.utf-8.spl« verwendet. Ist sie nicht
    vorhanden, bietet vim an, sie von der folgenden Adresse zu laden. https://ftp.nluug.nl/pub/vim/runtime/spell/de.utf-8.spl
    Mit diesem Wörterbuch werden aber die »ss« akzeptiert.

    Nun kann man im vim auch Wörterbücher von hunspell importieren.
    Die bestehen aus zwei Komponenten. In einer »*.dic«-Datei sind
    in Klartext zeilenweise Worte sowie Attribute gelistet. Die Worte sind
    quasi der Stamm und die Attribute beschreiben erlaubte Varianten.
    Diese Varianten sind in der dazugehörigen »*.aff«-Datei angegeben und beschreiben beispielsweise, wie die Mehrzahl konstruiert ist. Damit
    wird, zumindest für hunspell, aus einem gültigen Wortstamm ein gültiger Wortbaum.

    Unter vim kann man mit dem Befehl mkspell aus den Dateien für hunspell
    ein für vim passendes Wörterbuch erzeugen.

    Zumindest bei mir sind Wörterbücher unter »/usr/share/hunspell« zu finden. Wozu also woanders suchen?
    Darin sind allerdings einige Worte doppelt, die man eliminieren muss.
    Ansonsten funktioniert mkspell nicht. Worauf ich allerdings nicht
    gefasst war: in dem Wörterbuch findet man »Uhrlaub«, »Uhroma« und »Uhrwald«. Das ist mit natürlich nicht sofort aufgefallen.

    Daraufhin habe ich mich auf die Suche nach alternativen Quellen gemacht. Letztendlich habe ich die Dateien »de_DE.dic« und »de_DE.aff« von https://github.com/elastic/hunspell/tree/master/dicts
    geladen. In denen habe ich keine doppelten Worte festgestellt. Die
    Erzeugung von »de.utf-8.spl« hat problemlos funktioniert.

    Lange Rede - kurzer Sinn:
    Bei Wörterbüchern muss man auf alles gefasst sein. Das sind nun etwas
    mehr Zeilen geworden als erst gedacht. Vielleicht ist der
    Erfahrungsbericht zumindest amüsant, vielleicht sogar hilfreich :-).

    Ich hoffe für mich, dass meine Beiträge dadurch qualitativ weniger
    schlecht werden. Das war ja das eigentliche Ziel der Übung.

    Viele Grüße,
    Christoph
    --
    Ist die Katze gesund
    schmeckt sie dem Hund.

    -----BEGIN PGP SIGNATURE-----

    iQGzBAABCgAdFiEEj7zWuLpAjGEt2B3aIXCAe2OOngIFAmcICvEACgkQIXCAe2OO ngLB0gv8DVW8FM/6X/CjzlGezaHmLFSX2hYEMMUJRaYA7vgNUvUQLfNBHFUY5Jii 9O4bPzKdPagcKTbeZ2BCKMe6kG7G3QU2knhCLI9SVjJdQiKnjgnU2ON/ldkvJXv2 qJCBPJG2IZeFAdWH3kBZvLwaCGx6Q40NXxjqLoInjuM0NxTar4G0UJ00wr8D2lCM NU8nphmK4lfEoyuZ6H34dHw6NdTAynTJjZ8psFtefmVM8Fk2UCNylkqvn2FEDeiJ ZDU8fs8TWoSk/bSQOiGYskRU9vWZPrO7ztsP6F7kMI54EwOaCteycfgEiDWW+iJf BcFAjGWv3Cq1IXsVZadP0eb0snr68tF1w87PmXMJ7f51GN0iZYK9HZ91+9waDDB3 B4oD2VDRB50N0yZrg5/t/qA3P1dsR6jVTRwaPG9aTKBHd6jt+2CHaoaphEb5iYBa Xij/Legn55GtMUBsLheX8SlyjPWT9Y1+eSejfoMaZW3SJ+n2ZOzq6ThH9lXAeS0K
    boeJg+sW
    =gO8x
    -----END PGP SIGNATURE-----

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)
  • From Helge Kreutzmann@21:1/5 to All on Fri Oct 11 18:50:01 2024
    This is a MIME-formatted message. If you see this text it means that your E-mail software does not support MIME-formatted messages.

    Hallo Christoph,
    Am Thu, Oct 10, 2024 at 07:12:21PM +0200 schrieb Christoph Brinkhaus:
    Zumindest bei mir sind Wörterbücher unter »/usr/share/hunspell« zu finden.
    Wozu also woanders suchen?
    Darin sind allerdings einige Worte doppelt, die man eliminieren muss. Ansonsten funktioniert mkspell nicht. Worauf ich allerdings nicht
    gefasst war: in dem Wörterbuch findet man »Uhrlaub«, »Uhroma« und »Uhrwald«.
    Das ist mit natürlich nicht sofort aufgefallen.

    Kannst Du dazu einen Fehlerbericht erstellen?

    Daraufhin habe ich mich auf die Suche nach alternativen Quellen gemacht. Letztendlich habe ich die Dateien »de_DE.dic« und »de_DE.aff« von https://github.com/elastic/hunspell/tree/master/dicts

    Ist das ggf. eine neuere Version des Pakets? Das wäre natürlich gut.

    Viele Grüße

    Helge

    --
    Dr. Helge Kreutzmann debian@helgefjell.de
    Dipl.-Phys. http://www.helgefjell.de/debian.php
    64bit GNU powered gpg signed mail preferred
    Help keep free software "libre": http://www.ffii.de/

    -----BEGIN PGP SIGNATURE-----

    iQIzBAABCAAdFiEEbZZfteMW0gNUynuwQbqlJmgq5nAFAmcJVuMACgkQQbqlJmgq 5nAIdg/9HhBqsEWtAU7GYid+4hvDyEsVvFe9zRbTH/szo/MvOOmABM4nxnKHYdN/ TTQ8ZYWlMG/H7+g7dDNLWUIYzMCJ9qQU/S7a9UVN2PfAwk1DZY3yqKLuTqwUusyB us0ddtPHrpkvCQysyKaiSPB1oI81zxMdFAbvp5BedydNzTp/VasaNbpVA88GpWFs WGJix15+XOJB6ll/6sMBjaeu2TJDNB+WnitlI5wb9vWWNJWnK8iYTdizTDi8YYQF f+NTftr/ABHSqSkM5QrpAE1HTmRTt2uIcwc3j+Or7xJs2pCPuRh17H50DR128Oja JmNL2pCbox4Dbi9q0BcV7zeVA4WsyetpZE+9jvzD87Z6nb6T+5V1IWcwQwwxz6uM L5HjBefXtwV4kXtIfnRpq/9wX9PgUu2dWlwd4eTOF0BDrTKq/lCgsG682Zq9w/Ez gCgmye2qZfJdhsAtpj+8vLjvBshwu1dFHNkYeV6a43qxQ0dL0aWjO3+DuTjm60gM 87IICVaQ9zoM3p1uDGk3gCKppFle/ZT94dHNwbauTHb1o/t1JslxG+xlpufvACAm +Uc8RTPPng4MHND2B6yJVgawGRXrL6ht1jAB/PE
  • From Christoph Brinkhaus@21:1/5 to All on Fri Oct 11 20:10:01 2024
    Hallo Helge,
    Am Fri, Oct 11, 2024 at 04:48:35PM +0000 schrieb Helge Kreutzmann:
    Hallo Christoph,
    Am Thu, Oct 10, 2024 at 07:12:21PM +0200 schrieb Christoph Brinkhaus:
    Zumindest bei mir sind Wörterbücher unter »/usr/share/hunspell« zu finden.
    Wozu also woanders suchen?
    Darin sind allerdings einige Worte doppelt, die man eliminieren muss. Ansonsten funktioniert mkspell nicht. Worauf ich allerdings nicht
    gefasst war: in dem Wörterbuch findet man »Uhrlaub«, »Uhroma« und »Uhrwald«.
    Das ist mit natürlich nicht sofort aufgefallen.

    Kannst Du dazu einen Fehlerbericht erstellen?

    Daraufhin habe ich mich auf die Suche nach alternativen Quellen gemacht. Letztendlich habe ich die Dateien »de_DE.dic« und »de_DE.aff« von https://github.com/elastic/hunspell/tree/master/dicts

    Ist das ggf. eine neuere Version des Pakets? Das wäre natürlich gut.

    Ich werde mich auf die Suche machen und gegebenenfalls einen
    Fehlerbericht schreiben.

    Viele Grüße,
    Christoph
    --
    Ist die Katze gesund
    schmeckt sie dem Hund.

    -----BEGIN PGP SIGNATURE-----

    iQGzBAABCAAdFiEEj7zWuLpAjGEt2B3aIXCAe2OOngIFAmcJaCcACgkQIXCAe2OO ngJQcAv/YNMXBD1aqKmQnBvvW/6ikd9BVvk6B/uJ1RxfsmKYELFKqiARj2xXoPfV 71CPzKyDFznt9/D2wcA/jTRbZcLFYkBrwej5wmZ8XxASIt2lkBtUhyk8ER59KHrn wiPruetjkVZhrN3GmHE58YxCV1n9woIFzdR6vxojUL3Dny8rDKm7CAeVirGerPk/ oukg3mgOs8BDiP5AVta7CXUzXqaWxszGO0pNE04tOmNs1aw22rT8EhYgXLHoMtSc j8Yg6eiZWV28o36t6vfANLBFgO78jdagKMwYixg6pW8Ghga/DWJN0v2dYmqK2FSM r1S6Rje8aL21FtMLHnG18MoJKlKq8S/weZCEAXvrAffX9g2orO/68XuzKu2mox63 LQGtdpTvn3kb2hbDPfyN+JbzGwzJRQlrZ79HVxDZnWi5+KwjQPMwVO7OnBuTJR7V kRiKv70bQ7bVyW4ziCyNc6XtznORwbkCF9Y8OWtsWqZT6B+nO8Dl8CSFkyblenCw
    nYAeAukB
    =+nYN
    -----END PGP SIGNATURE-----

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)
  • From Christoph Brinkhaus@21:1/5 to All on Sat Oct 12 15:50:01 2024
    Hallo Helge,
    Am Fri, Oct 11, 2024 at 08:02:15PM +0200 schrieb Christoph Brinkhaus:
    Hallo Helge,
    Am Fri, Oct 11, 2024 at 04:48:35PM +0000 schrieb Helge Kreutzmann:
    Hallo Christoph,
    Am Thu, Oct 10, 2024 at 07:12:21PM +0200 schrieb Christoph Brinkhaus:
    Zumindest bei mir sind Wörterbücher unter »/usr/share/hunspell« zu finden.
    Wozu also woanders suchen?
    Darin sind allerdings einige Worte doppelt, die man eliminieren muss. Ansonsten funktioniert mkspell nicht. Worauf ich allerdings nicht
    gefasst war: in dem Wörterbuch findet man »Uhrlaub«, »Uhroma« und »Uhrwald«.
    Das ist mit natürlich nicht sofort aufgefallen.

    Kannst Du dazu einen Fehlerbericht erstellen?

    Die Worte wie »Uhrlaub« sind bewusst als häufige Tippfehler in das
    Wörterbuch aufgenommen und als solche mit der Markierung »d« versehen.
    Die entsprechende Definition findet man in »de_DE.aff« in der Zeile "FORBIDDENWORD d". Die Dokumentation zu diesen Dingen ist mir unter
    Debian nicht ganz klar. Etwas wie
    https://linux.die.net/man/1/hunspell,
    https://linux.die.net/man/3/hunspell oder
    https://linux.die.net/man/4/hunspell finde ich hier nicht.
    Gerade hunspell(4) beschreibt das Format der »*.dic«- und
    »*.aff«-Dateien.

    Daraufhin habe ich mich auf die Suche nach alternativen Quellen gemacht. Letztendlich habe ich die Dateien »de_DE.dic« und »de_DE.aff« von https://github.com/elastic/hunspell/tree/master/dicts

    Ist das ggf. eine neuere Version des Pakets? Das wäre natürlich gut.

    Ich werde mich auf die Suche machen und gegebenenfalls einen
    Fehlerbericht schreiben.

    Ich habe nun in vielen Beschreibungen gelesen, dass das Wörterbuch aus
    den »frami«-Versionen generiert wurde, was auch Libreoffice verwendet.
    Dazu gibt es ein passendes Paket hunspell-de-de-frami, dessen Wörterbuch
    wie das von hunspell-de-de doppelte Einträge und verbotene Einträge
    beinhaltet. Damit funktioniert auch der Befehl
    :mkspell de /usr/share/hunspell/de_DE_frami.
    Die Worte wie »standardmässig« werden moniert.

    Das erklärt aber nicht, wieso das Wörtterbuch vom ftp-Server das nicht
    macht und wieso die Erzeugung des Wörterbuchs aus hunspell-de-de nicht funktioniert.

    Ich habe die Frage nun mal in de.comp.editor gestellt. Vielleicht
    bekomme ich dort eine Antwort.

    Viele Grüße,
    Christoph
    --
    Ist die Katze gesund
    schmeckt sie dem Hund.

    -----BEGIN PGP SIGNATURE-----

    iQGzBAABCgAdFiEEj7zWuLpAjGEt2B3aIXCAe2OOngIFAmcKfkMACgkQIXCAe2OO ngKI+Av+NzMAGgWDYqUPsD3ovlWvrJEMQE+q3JzoYVS1Zf34SBF9kWzoL9xUzxsj A7uzuWyDfSh3Bwka0T6R/rUXBgEVQblkwUX/3Umj8An5y8eFGBVfLxzA04h/Um5u wjQ8lIFICQlxUkqH4xFzH7B0Zp8DgyBadzUpZmJ+eGNwPK4QbpMHimL/JRjG30aB bfwbgOGg+yEvHcK76zxGHTTWSmsqib8Ndwcq53Ktu0rncmyuK44iV4YhZ9tnQ5Vc 8QRZlxtWPXRLiadf70p+3KBQMpfMJ3AnAHu1P1RFSVXRqbrXYgRixFhVZ9abQEGg v9Ja1PtubH/uAhdV8bixm2S7FXfU1CE9DBOF6OMNVISgzLEouk4NVbY+z3NWI97M sVhvMqjj32F3QgOxMyOHt+N2ojgSvDlSP77vJrRSTPvf8uRykTd7uUhySONuthrr 8KBGiphd/H497z8JqZ85QvcaWyx96hKghPK2kNAUr2JMdL+tMI/X3WL1UgBKqXHz
    o0g/VGvA
    =jiRN
    -----END PGP SIGNATURE-----

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)
  • From Holger Wansing@21:1/5 to All on Sat Oct 12 17:40:01 2024
    Hi,

    Am 12. Oktober 2024 15:48:55 MESZ schrieb Christoph Brinkhaus <c.brinkhaus@t-online.de>:
    "FORBIDDENWORD d". Die Dokumentation zu diesen Dingen ist mir unter
    Debian nicht ganz klar. Etwas wie
    https://linux.die.net/man/1/hunspell,
    https://linux.die.net/man/3/hunspell oder >https://linux.die.net/man/4/hunspell finde ich hier nicht.
    Gerade hunspell(4) beschreibt das Format der »*.dic«- und >»*.aff«-Dateien.

    <https://manpages.debian.org/bookworm/hunspell/hunspell.1.en.html>

    <https://manpages.debian.org/bookworm/libhunspell-dev/hunspell.3.en.html>

    <https://manpages.debian.org/bookworm/libhunspell-dev/hunspell.5.en.html>


    Einfach auf manpages.debian.org "hunspell" eingeben, und auf
    der so gefundenen Seite finden sich ganz unten Verweise auf
    verwandte Seiten (das ist ja Standard bei den manpages).


    Holger



    --
    Sent from /e/ OS on Fairphone3

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)
  • From Christoph Brinkhaus@21:1/5 to All on Sat Oct 12 17:50:01 2024
    Hallo Holger,
    Am Sat, Oct 12, 2024 at 05:34:09PM +0200 schrieb Holger Wansing:
    Hi,

    Am 12. Oktober 2024 15:48:55 MESZ schrieb Christoph Brinkhaus <c.brinkhaus@t-online.de>:
    "FORBIDDENWORD d". Die Dokumentation zu diesen Dingen ist mir unter
    Debian nicht ganz klar. Etwas wie
    https://linux.die.net/man/1/hunspell,
    https://linux.die.net/man/3/hunspell oder >https://linux.die.net/man/4/hunspell finde ich hier nicht.
    Gerade hunspell(4) beschreibt das Format der »*.dic«- und
    »*.aff«-Dateien.

    <https://manpages.debian.org/bookworm/hunspell/hunspell.1.en.html>

    <https://manpages.debian.org/bookworm/libhunspell-dev/hunspell.3.en.html>

    <https://manpages.debian.org/bookworm/libhunspell-dev/hunspell.5.en.html>


    Einfach auf manpages.debian.org "hunspell" eingeben, und auf
    der so gefundenen Seite finden sich ganz unten Verweise auf
    verwandte Seiten (das ist ja Standard bei den manpages).

    Es hätte mich auch gewundert, wenn es das auf Debian nicht gegeben
    hätte.

    Zu den Worten wie »standardmässig« habe ich inzwischen einen Hinweis
    bekommen. Das entspricht wohl der Schweizer Schreibweise. In dem
    Wörterbuch auf dem ftp-Server, auf das vim verweist sind wohl
    de_DE und de_CH eingebunden. Wahrscheinlich ist de_AT ebenfalls
    integriert.

    Viele Grüße,
    Christoph
    --
    Ist die Katze gesund
    schmeckt sie dem Hund.

    -----BEGIN PGP SIGNATURE-----

    iQGzBAABCAAdFiEEj7zWuLpAjGEt2B3aIXCAe2OOngIFAmcKmMYACgkQIXCAe2OO ngI4Kgv/e6vGT3+mBumvAV1zAgsgpsSneaYtXq5YFq/U+x1UzTFeNQk5TXwhsU48 bV/ApzpU52VoZ8/R6FB04jpdy/TuhKAbr0oo4HIX0NMcZD0ssPc1A6otbslLdVJ3 d5LmEJulU+xE23RwiuA+V+RXt2NNo7nq4jxtuVealWLJT+dKxIa2YPd4wqlpWaAG TZO8ag6ntgsI8tkgm1y7F0/XZEKbaCan//m5F0TOTx+bXXKhCG444X2jm5Ianrd6 2isoCOJdr4tbsPaP0vK8ObWjIcHCjNyVxtOjLfCbfn1b+Far6iVOzYqatqVaqHmb Qzc5VoPrFjBU2gMtbh4sfKqU5vQArlewiZUPL3R2jmQvcm5RtFE/OBbNFXAi+4W8 hWp3tD01SmYQmvSVHynfvrSP91zIp/3cfesh7DGpGUR+NHnTLwoRoo0PSicGaLWr VQfFNmaqoNCOlUr+BnRyCa+CYlWy3D0JtLNQhzC4tBd+h+dVKNWHChQjV9h407rM
    /rhcqXKq
    =/8yu
    -----END PGP SIGNATURE-----

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)