• [RFR] man://manpages-l10n/regex.7.po (1/2)

    From Helge Kreutzmann@21:1/5 to All on Sun Apr 30 19:10:01 2023
    This is a MIME-formatted message. If you see this text it means that your E-mail software does not support MIME-formatted messages.

    --hYooF8G/hrfVAmum
    Content-Type: text/plain; charset=utf-8
    Content-Disposition: inline
    Content-Transfer-Encoding: quoted-printable

    Hallo Mitübersetzer,
    ich habe kürzlich eine Handbuchseite aus Abschnitt 7 übersetzt.

    Es sind insgesamt 47 Zeichenketten, nicht ganz gleichmäßig auf
    zwei Teile aufgeteilt.

    Die Handbuchseite ist auch inhaltlich trickiger. Insbesondere das
    Konzept und die Übersetzung des Begriffs „collating element“ ist mir schwer gefallen. Im ersten Anlauf habe ich „Zuordnungselement“
    genommen, aber Wikipedia gitb folgendes: https://en.wikipedia.org/wiki/Collation_(disambiguation)
    In library, information and computer science, collation is the process
    of assembling written information into a standard order.

    Das Konzept wird auch etwas (mehr) in https://www.gnu.org/software/gnulib/manual/html_node/Collating-Elements-vs_002e-Characters.html
    erklärt.

    Daher überlege ich, ggf. „Sortierelement“ zu verwenden.

    Für konstruktives Korrekturlesen wäre ich sehr dankbar.

    Viele Grüße

    Helge

    --
    Dr. Helge Kreutzmann debian@helgefjell.de
    Dipl.-Phys. http://www.helgefjell.de/debian.php
    64bit GNU powered gpg signed mail preferred
    Help keep free software "libre": http://www.ffii.de/

    --hYooF8G/hrfVAmum
    Content-Type: text/plain; charset=utf-8
    Content-Disposition: attachment; filename="regex.7.1.po" Content-Transfer-Encoding: quoted-printable

    # German translation of manpages
    # This file is distributed under the same license as the manpages-l10n package. # Copyright © of this file:
    # Helge Kreutzmann <debian@helgefjell.de>, 2023.
    msgid ""
    msgstr ""
    "Project-Id-Version: manpages-l10n 4.18.1\n"
    "POT-Creation-Date: 2023-02-20 20:24+0100\n"
    "PO-Revision-Date: 2023-04-29 16:15+0200\n"
    "Last-Translator: Helge Kreutzmann <debian@helgefjell.de>\n"
    "Language-Team: German <debian-l10n-german@lists.debian.org>\n"
    "Language: de\n"
    "MIME-Version: 1.0\n"
    "Content-Type: text/plain; charset=UTF-8\n"
  • From Christoph Brinkhaus@21:1/5 to All on Tue May 2 11:20:01 2023
    Am Sun, Apr 30, 2023 at 07:03:06PM +0200 schrieb Helge Kreutzmann:

    Hallo,

    [...]

    Die Handbuchseite ist auch inhaltlich trickiger. Insbesondere das
    Konzept und die Übersetzung des Begriffs „collating element“ ist mir schwer gefallen. Im ersten Anlauf habe ich „Zuordnungselement“
    genommen, aber Wikipedia gitb folgendes: https://en.wikipedia.org/wiki/Collation_(disambiguation)
    In library, information and computer science, collation is the process
    of assembling written information into a standard order.

    Das Konzept wird auch etwas (mehr) in https://www.gnu.org/software/gnulib/manual/html_node/Collating-Elements-vs_002e-Characters.html
    erklärt.

    Daher überlege ich, ggf. „Sortierelement“ zu verwenden.

    Laut www.leo.org kann man collation mit Zusammenführung,
    Zusammenfassung und ähnlichen Worten übersetzen. Nach meinem
    Verständnis ist ein "collation" eine "Zeichenkette". Der
    Begriff Zeichenkette taucht auch in vielen Artikeln über reguläre
    Ausdrücke auf.

    Zu dem gnu Link:
    "POSIX generalizes the notion of a character to that of a collating
    element. It defines a collating element to be “a sequence of one or
    more bytes defined in the current collating sequence as a unit of
    collation.”

    In dem Sinne sind "collating elements" Zeichen in einer Zeichenkette.
    Was dann als "character" bezeichnet wird ist ein Multibyte-Zeichen,
    was Helge als "Multizeichen-Zuordnungselement" übersetzt hat.

    Nochmal zum Link:
    "Since POSIX’s “collating element” preserves the essential idea of a
    “character,” we use the latter, more familiar, term in this
    document."

    Es wird also im weiteren Text "character" statt dem sperrigeren
    "collating elements" verwendet. In dem Sinne könnten wir statt einer
    sperrigen Übersetzung ebenfalls nur "Zeichen" schreiben.

    Was haltet ihr davon?

    Viele Grüße,
    Christoph

    -----BEGIN PGP SIGNATURE-----

    iQGzBAABCgAdFiEEj7zWuLpAjGEt2B3aIXCAe2OOngIFAmRQ1YcACgkQIXCAe2OO ngK37gwAhBPCnlsvjyVbROrvzrT1CZY7MP9n67+fXmQNV+Xup0niofVof9W5tviv dzRooestoLdQ2vCQOXgb26YiugY81jP1Q78M2d7Uzy2iW/5T2PRwo7dMAJJTRsVH BZmKqZjyVgHFHa7VZ4/aWO1Zzn2Yu6Ao5i5F7BjdApVu+G/IKBsXPs78uD40TXF5 vMr3fGjocimAKjZOJDO5GsOTxAMNhu1TUF9cmk7JniRfBNi8zZqCaDQObXf+fq3z 5YvWbyVF4vpXh0GIhIUcftoyb6j0+9mQJM3ZuX36hEGey3GCQADN2fn9vFV7Ei/b SgU7K8Iop2TmoG53PxwDEACGk2ww+BBE+OjOsn4xEaz5O6B83km2L3YjjIewnHor PhNoNu8lAbmu8HFLfYBOZ0UnpXkMUTnxhcB2j6JRv5eFH3ti1ryfn0y5EfNN6dQT DXQXA/FJv3/XmCjzX77jsOzwNOoYq9UjwvjGiy25DYmIsmUibrQjzqgpelsww3bQ
    E/kRvkqu
    =O3w5
    -----END PGP SIGNATURE-----

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)
  • From Christoph Brinkhaus@21:1/5 to All on Wed May 3 15:50:01 2023
    Am Tue, May 02, 2023 at 11:19:08AM +0200 schrieb Christoph Brinkhaus:
    Am Sun, Apr 30, 2023 at 07:03:06PM +0200 schrieb Helge Kreutzmann:

    Nochmal Hallo,

    die Zeilen von meinem letzten Beitrag weiter unten habe ich gelöscht.
    Ich habe einen Vorschlag bekommen, den ich unten Vorstelle.

    [...]

    Die Handbuchseite ist auch inhaltlich trickiger. Insbesondere das
    Konzept und die Übersetzung des Begriffs „collating element“ ist mir schwer gefallen. Im ersten Anlauf habe ich „Zuordnungselement“ genommen, aber Wikipedia gitb folgendes: https://en.wikipedia.org/wiki/Collation_(disambiguation)
    In library, information and computer science, collation is the process
    of assembling written information into a standard order.

    Das Konzept wird auch etwas (mehr) in https://www.gnu.org/software/gnulib/manual/html_node/Collating-Elements-vs_002e-Characters.html
    erklärt.

    Daher überlege ich, ggf. „Sortierelement“ zu verwenden.

    Der Hinweis bezieht sich auf die deutschen Uebersetzung des
    Standardwerks von Friedl.

    Dort wird folgenderemassen übersetzt:
    „collating element“ : Kollationselement
    „collating sequence“ : Kollationssequenz

    Weil ich die Begriffe noch nie gelesen oder gehört habe habe ich
    zusätzlich gesucht und folgendes gefunden:

    Die Begriffe werden im Wörterbuch wie unten genauso übersetzt: https://glosbe.com/en/de/collation%20sequence

    Kollationselement wird auch in einer deutschen Übersetzung der Tcl/Tk Dokumentation verwendet. https://runebook.dev/de/docs/tcl_tk/tclcmd/re_syntax.htm

    Beide Begriffe werden in einer _schwedischen_ po Vorlage werwendet: https://sources.debian.org/data/main/g/glibc/2.28-8/po/sv.po

    #: locale/programs/ld-collate.c:441
    #, c-format
    msgid "`%.*s' already defined as collating symbol"
    msgstr "\"%.*s\" redan definierad som ett kollationssymbol"

    #: locale/programs/ld-collate.c:448
    #, c-format
    msgid "`%.*s' already defined as collating element"
    msgstr "\"%.*s\" redan definierad som ett kollationselement"

    Das scheint also zu passen. Wie ist eure Meinung?

    Viele Grüße,
    Christoph

    -----BEGIN PGP SIGNATURE-----

    iQGzBAABCgAdFiEEj7zWuLpAjGEt2B3aIXCAe2OOngIFAmRSZeAACgkQIXCAe2OO ngJcdQv/QhPuiwCp40zZlLB/t1IrjU+GZeBlcu9MBdNhPfEXSrIQDod/HCalOEvd 80NEBmquv3Sq5ojVgNUMxXdXR2ArH+UVLqBy43YRsBbSua+yWG9AG7+ebcOUzROy 3gsxzJXygfROHFfetiZ3Tp/9g8uR4FPbTg338sWZOFJaiJwnTvuK1HpsDidwSXr4 r6/JnhsS9FhDk6DY8KE46L6OdICSENlWlD3X6nWTVMzUBD4hdK9wwfGbjg0QxrTL ahX5fMEb/mT85av21gwFT8P9iGtgPcu9LNXGgwvmvmRH7cW0mTiZfLT2pCz4yA0d 0XsODcfqnif//9fj6oGmgHs9cJxtXBH1WyyXlr82n2y72uYqf3ui9SEcZzdGtX8J xfeLbVF9ODKU9xDzypPSg3+8pHbsfsJO7HHxW0fhauv0Tt4leSMX8Vx85bkLxUb8 YjGbT0Vd4xfAj5a5TDUlYwTuB2CKGujXzvk09jkeAfZoyRMKWHyq8fGTRUkBVn/P
    VcZ+V9no
    =tDUM
    -----END PGP SIGNATURE-----

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)
  • From markus schnalke@21:1/5 to All on Wed May 3 17:00:01 2023
    Hoi,

    ich bin auf diese Diskussion aufmerksam gemacht worden. Zwar habe
    ich nicht viel Erfahrung mit Uebersetzungen, aber ich kenne mich
    mit REs gut aus, darum will ich versuchen, bei dieser ja doch recht
    schwierigen Uebersetzung zu unterstuetzen. Ich hoffe, dass meine
    Kommentare und Vorschlaege die Arbeit erleichtern.


    [2023-05-03 15:47] Christoph Brinkhaus <c.brinkhaus@t-online.de>

    Am Tue, May 02, 2023 at 11:19:08AM +0200 schrieb Christoph Brinkhaus:
    Am Sun, Apr 30, 2023 at 07:03:06PM +0200 schrieb Helge Kreutzmann:

    Nochmal Hallo,

    die Zeilen von meinem letzten Beitrag weiter unten habe ich gelöscht.
    Ich habe einen Vorschlag bekommen, den ich unten Vorstelle.

    [...]

    Die Handbuchseite ist auch inhaltlich trickiger. Insbesondere das
    Konzept und die Übersetzung des Begriffs „collating element“ ist mir schwer gefallen. Im ersten Anlauf habe ich „Zuordnungselement“ genommen, aber Wikipedia gitb folgendes: https://en.wikipedia.org/wiki/Collation_(disambiguation)
    In library, information and computer science, collation is the process
    of assembling written information into a standard order.

    Das Konzept wird auch etwas (mehr) in https://www.gnu.org/software/gnulib/manual/html_node/Collating-Elements-vs_002e-Characters.html
    erklärt.

    Daher überlege ich, ggf. „Sortierelement“ zu verwenden.

    Der Hinweis bezieht sich auf die deutschen Uebersetzung des
    Standardwerks von Friedl.

    Dort wird folgenderemassen übersetzt:
    „collating element“ : Kollationselement
    „collating sequence“ : Kollationssequenz

    Weil ich die Begriffe noch nie gelesen oder gehört habe habe ich
    zusätzlich gesucht und folgendes gefunden:

    Die Begriffe werden im Wörterbuch wie unten genauso übersetzt: https://glosbe.com/en/de/collation%20sequence

    Kollationselement wird auch in einer deutschen Übersetzung der Tcl/Tk Dokumentation verwendet. https://runebook.dev/de/docs/tcl_tk/tclcmd/re_syntax.htm

    Beide Begriffe werden in einer _schwedischen_ po Vorlage werwendet: https://sources.debian.org/data/main/g/glibc/2.28-8/po/sv.po

    #: locale/programs/ld-collate.c:441
    #, c-format
    msgid "`%.*s' already defined as collating symbol"
    msgstr "\"%.*s\" redan definierad som ett kollationssymbol"

    #: locale/programs/ld-collate.c:448
    #, c-format
    msgid "`%.*s' already defined as collating element"
    msgstr "\"%.*s\" redan definierad som ett kollationselement"

    Das scheint also zu passen. Wie ist eure Meinung?

    Eine wirklich gute, also sowohl inhaltlich treffende als auch
    begriffsnahe, Uebersetzung kenne ich nicht. Collation ist die Sortierreihenfolge/Sortierordnung, also z.B. dass `ä' nach `a'
    kommt.

    Ich denke, man muss sich entscheiden, ob man eher wortnaeher
    uebersetzt (also fuer eine Person, die vielleicht nur ein bisschen
    Englisch kann und sich ueber den deutschen Text das englische
    Original erschliesst) oder ob die Uebersetzung moeglichst fluessig
    deutsch klingen soll. Da es sich hier um eine moeglichst exakte
    technische Zusammenfassung der RE-Definition von POSIX handelt,
    wuerde ich wohl eher zu ersterem tendieren. Laien werden die Seite
    kaum lesen und Profis werden moeglichst viel Uebereinstimmung mit
    dem englischen Original wuenschen, denke ich mir.


    Hier nun allerlei Kommentare, zu verschiedenen Stellen. Sie sind
    IMO nicht vollstaendig in sich stimmig. Dazu muesste man dann den
    gesamten Text nochmal am Stueck lesen, ob er stimmig wirkt.


    | Am Sun, Apr 30, 2023 at 07:03:06PM +0200 schrieb Helge Kreutzmann:
    |
    | # German translation of manpages
    | # This file is distributed under the same license as the manpages-l10n package.
    | # Copyright © of this file:
    | # Helge Kreutzmann <debian@helgefjell.de>, 2023.
    | msgid ""
    | msgstr ""
    | "Project-Id-Version: manpages-l10n 4.18.1\n"
    | "POT-Creation-Date: 2023-02-20 20:24+0100\n"
    | "PO-Revision-Date: 2023-04-29 16:15+0200\n"
    | "Last-Translator: Helge Kreutzmann <debian@helgefjell.de>\n"
    | "Language-Team: German <debian-l10n-german@lists.debian.org>\n"
    | "Language: de\n"
    | "MIME-Version: 1.0\n"
    | "Content-Type: text/plain; charset=UTF-8\n"
    | "Content-Transfer-Encoding: 8bit\n"
    | "Plural-Forms: nplurals=2; plural=(n != 1);\n"


    | # FIXME I<egrep> → B<egrep>(1)
    | #. type: Plain text
    | #: archlinux debian-bullseye debian-unstable fedora-38 fedora-rawhide
    | #: mageia-cauldron opensuse-leap-15-5 opensuse-tumbleweed
    | msgid ""
    | "Regular expressions (\"RE\"s), as defined in POSIX.2, come in two forms: "
    | "modern REs (roughly those of I<egrep>; POSIX.2 calls these \"extended\" "
    | "REs) and obsolete REs (roughly those of B<ed>(1); POSIX.2 \"basic\" REs). "
    | "Obsolete REs mostly exist for backward compatibility in some old programs; " | "they will be discussed at the end. POSIX.2 leaves some aspects of RE syntax "
    | "and semantics open; \"\\*(dg\" marks decisions on these aspects that may not "
    | "be fully portable to other POSIX.2 implementations."
    | msgstr ""
    | "Reguläre Ausdrücke (»RA«), wie sie in POSIX.2 definiert sind, kommen in zwei "
    | "Formen:

    Vorschlag: ``gibt es in zwei Arten''

    | moderne RA (ungefähr die von B<egrep>(1); POSIX.2 nennt sie "
    | "»erweiterte« RA) und veraltete RA (ungefähr die von B<ed>(1); gemäß POSIX.2 "
    | "»einfache« RA). Veraltete RA existieren hauptsächlich zur "
    | "Rückwärtskompatibilität in einigen alten Programmen; sie werden am Ende " | "beschrieben. POSIX.2 lässt einige Aspekte der RA-Syntax und -Semantik offen; "
    | "»\\(dg« markiert Entscheidungen zu diesen Aspekten, die nicht vollständig "
    | "portabel zu anderen POSIX.2-Implementierungen sein können."


    | #. type: Plain text
    | #: archlinux debian-unstable fedora-38 fedora-rawhide mageia-cauldron
    | msgid ""
    | "A piece is an I<atom> possibly followed by a single\\*(dg \\[aq]*\\[aq], "
    | "\\[aq]+\\[aq], \\[aq]?\\[aq], or I<bound>. An atom followed by "
    | "\\[aq]*\\[aq] matches a sequence of 0 or more matches of the atom. An atom "
    | "followed by \\[aq]+\\[aq] matches a sequence of 1 or more matches of the "
    | "atom. An atom followed by \\[aq]?\\[aq] matches a sequence of 0 or 1 "
    | "matches of the atom."
    | msgstr ""
    | "Ein Stück ist ein I<Atom>, möglicherweise gefolgt von einem einzelnen\\(dg "
    | "»*«, »+«, »?« oder einer I<Begrenzung>.

    ``Beschraenkung'' finde ich hier etwas treffender, finde ich, weil es
    hierbei um eine beschraenkte Anzahl von Wiederholungen geht. (Muss
    dann natuerlich auch im weiteren Text geaendert werden.)

    | Ein Atom, auf das ein »*« folgt, "
    | "stimmt mit einer Sequenz von 0 oder mehr Übereinstimmungen mit diesem Atom "
    | "überein. Ein Atom, auf das ein »+« folgt, stimmt mit einer Sequenz von 1 "
    | "oder mehr Übereinstimmungen mit diesem Atom überein. Ein Atom, auf das ein "
    | "»?« folgt, stimmt mit einer Sequenz von 0 oder 1 Übereinstimmungen mit " | "diesem Atom überein."
    |
    | #. type: Plain text
    | #: archlinux debian-unstable fedora-38 fedora-rawhide mageia-cauldron
    | msgid ""
    | "A I<bound> is \\[aq]{\\[aq] followed by an unsigned decimal integer, "
    | "possibly followed by \\[aq],\\[aq] possibly followed by another unsigned "
    | "decimal integer, always followed by \\[aq]}\\[aq]. The integers must lie " | "between 0 and B<RE_DUP_MAX> (255\\*(dg) inclusive, and if there are two of " | "them, the first may not exceed the second. An atom followed by a bound "
    | "containing one integer I<i> and no comma matches a sequence of exactly I<i> "
    | "matches of the atom. An atom followed by a bound containing one integer "
    | "I<i> and a comma matches a sequence of I<i> or more matches of the atom. An "
    | "atom followed by a bound containing two integers I<i> and I<j> matches a "
    | "sequence of I<i> through I<j> (inclusive) matches of the atom."
    | msgstr ""
    | "Eine I<Begrenzung> ist »{« gefolgt von einer vorzeichenlosen Dezimalzahl, "

    Hier fehlt die Ganzzahligkeit. Am korrektesten waere wohl:
    ``vorzeichenlose Ganzzahl in Dezimaldarstellung''.

    ``Dezimalzahl'' waere missverstaendlich, denn siehe:

    Unter einer Dezimalzahl versteht man

    - Eine Zahl im Dezimalsystem, das als Basis die Zahl 10 verwendet
    - Eine in „Kommaschreibweise“ geschriebene Kommazahl, also 0,5
    statt 1⁄2 – siehe Nachkommastelle

    https://de.wikipedia.org/wiki/Dezimalzahl

    Die zweite Bedeutung muss unbedingt vermieden werden, da gerade im
    Deutschen das Komma als Dezimaltrenner vorkommt, was hier aber
    keinesfalls so gedeutet werden darf. Hier ist das Komma ein
    Separator. Konkret sieht das ja beispielsweise so aus: a{2,3}

    | "möglicherweise gefolgt von »,«, möglicherweise gefolgt von einer weiteren "
    | "vorzeichenlosen Dezimalzahl, immer gefolgt von »}«. Die ganzen Zahlen müssen "
    | "zwischen 0 und B<RE_DUP_MAX> (255\\(dg) einschließlich liegen und falls es "
    | "davon zwei gibt, darf die erste die zweite nicht übersteigen.

    ``... darf die erste nicht groesser als die zweite sein.''
    (einfachere Sprache)

    | Ein Atom, auf "
    | "das eine Begrenzung folgt, die eine Ganzzahl I<i> und kein Komma enthält, " | "stimmt auf eine Sequenz von genau I<i> Übereinstimmungen des Atoms überein. "
    | "Ein Atom, auf das eine Begrenzung folgt, die eine Ganzzahl I<i> und ein "
    | "Komma enthält, stimmt auf eine Sequenz von I<i> oder mehr Übereinstimmungen "
    | "des Atoms überein. Ein Atom, auf das eine Begrenzung folgt, die zwei "
    | "Ganzzahlen I<i> und I<j> enthalten, stimmt auf eine Sequenz von I<i> bis "
    | "einschließlich I<j> Übereinstimmungen des Atoms überein."
    |
    | #. type: Plain text
    | #: archlinux debian-unstable fedora-38 fedora-rawhide mageia-cauldron
    | msgid ""
    | "An atom is a regular expression enclosed in \"I<()>\" (matching a match for "
    | "the regular expression), an empty set of \"I<()>\" (matching the null "
    | "string)\\*(dg, a I<bracket expression> (see below), \\[aq].\\[aq] (matching "
    | "any single character), \\[aq]\\[ha]\\[aq] (matching the null string at the " | "beginning of a line), \\[aq]$\\[aq] (matching the null string at the end of "
    | "a line), a \\[aq]\\e\\[aq] followed by one of the characters \"I<\\[ha].[$()|"
    | "*+?{\\e>\" (matching that character taken as an ordinary character), a "
    | "\\[aq]\\e\\[aq] followed by any other character\\*(dg (matching that "
    | "character taken as an ordinary character, as if the \\[aq]\\e\\[aq] had not "
    | "been present\\*(dg), or a single character with no other significance "
    | "(matching that character). A \\[aq]{\\[aq] followed by a character other " | "than a digit is an ordinary character, not the beginning of a bound\\*(dg. "
    | "It is illegal to end an RE with \\[aq]\\e\\[aq]."
    | msgstr ""
    | "Ein Atom ist ein regulärer Ausdruck, der in »I<()>« eingeschlossen ist (der "
    | "eine Übereinstimmung mit dem regulären Ausdruck darstellt), eine leere Menge "
    | "aus »I<()>« (der mit der leeren Zeichenkette übereinstimmt)\\(dg, ein "
    | "I<Klammerausdruck> (siehe unten),

    ``Klammerausdruck'' ist etwas unguenstig im Deutschen. Im
    Englischen gibt es drei verschiedene Begriffe fuer die drei
    Klammerarten: parentheses (), brackets [], braces {}. Im Deutschen
    bezeichnet Klammern alle drei. Ich denke, da ``Klammerausdruck''
    uneindeutig ist, wird in der deutschen Uebersetzung von Friedls
    ``Regulaere Ausdruecke'' (O'Reilly) fuer ``bracket expression'' die
    etwas ungenaue aber pragmatischere hilfreichere Bezeichnung
    ``Zeichenklasse'' verwendet. Aus meiner Sicht kann man beide Wege
    gehen. Ich wollte es vor allem der Vollstaendigkeit halber
    erwaehnen.

    | ».« (das mit einem einzelnen Zeichen "
    | "übereinstimmt), »\\[ha]« (das mit der leeren Zeichenkette am Zeilenanfang "
    | "übereinstimmt), »$« (das mit der leeren Zeichenkette am Zeilenende "
    | "übereinstimmt), einem »\\e« gefolgt von einem der Zeichen »I<\\[ha].[$()|*+?"
    | "{\\e>« (das mit diesem Zeichen, das als normales Zeichen betrachtet wird, " | "übereinstimmt), einem »\\e« gefolgt von einem normalen Zeichen\\(dg (das mit "
    | "dem Zeichen als normales Zeichen übereinstimmt, als ob »\\e« nicht vorhanden "
    | "wäre\\(dg) oder einem einzelnen Zeichen mit keiner weiteren Bedeutung (was "
    | "mit diesem Zeichen übereinstimmt). Ein »{« gefolgt von einem Zeichen, das "
    | "keine Ziffer ist, ist ein normales Zeichen, nicht der Anfang einer "
    | "Begrenzung\\(dg. Es ist verboten, einen RA mit »\\e« abzuschließen."

    | #. type: Plain text
    | #: archlinux debian-unstable fedora-38 fedora-rawhide mageia-cauldron
    | msgid ""
    | "A I<bracket expression> is a list of characters enclosed in \"I<[]>\". It " | "normally matches any single character from the list (but see below). If the "
    | "list begins with \\[aq]\\[ha]\\[aq], it matches any single character (but " | "see below) I<not> from the rest of the list. If two characters in the list "
    | "are separated by \\[aq]-\\[aq], this is shorthand for the full I<range> of " | "characters between those two (inclusive) in the collating sequence, for "
    | "example, \"I<[0-9]>\" in ASCII matches any decimal digit. It is "
    | "illegal\\*(dg for two ranges to share an endpoint, for example, \"I<a-c-"
    | "e>\". Ranges are very collating-sequence-dependent, and portable programs " | "should avoid relying on them."
    | msgstr ""
    | "Ein I<Klammerausdruck> ist eine Liste von Zeichen, die in »I<[]>« "
    | "eingeschlossen sind. Er stimmt normalerweise mit einem einzelnen Zeichen aus "
    | "der Liste überein (siehe aber nachfolgend). Falls die Liste mit einem "
    | "»\\[ha]« beginnt, stimmt er mit jedem einzelnen Zeichen (siehe aber "
    | "nachfolgend) überein, das I<nicht> in der Liste ist. Falls zwei Zeichen in "
    | "der Liste durch ein »-« getrennt sind, ist dies eine Abkürzung für den " | "vollständigen I<Bereich> der Zeichen zwischen diesen zwei (einschließlich) "

    Besser ``den ganzen Bereich'' statt ``den vollstaendigen Bereich''.

    | "in der Zuordnungssequenz,

    Ich wuerde hier ``Sortierordnung'' schreiben, denn das ist es was
    inhaltlich gemeint ist. (Das betrifft weitere Stellen im Text.)

    | beispielsweise stimmt »I<[0-9]>« in ASCII mit "
    | "jeder dezimale Ziffer überein.

    ``dezimalen'' (mit `n')

    | Es ist verboten\\(dg, dass zwei Bereiche den "
    | "gleichen Endpunkt haben, beispielsweise »I<a-c-e>«. Bereiche hängen stark "
    | "von der Zuordnungssequenz ab und portierbare Programme sollten vermeiden, " | "davon abzuhängen."

    | # FIXME Collating eher Sortieren statt Zuordnen
    | # https://www.gnu.org/software/gnulib/manual/html_node/Collating-Elements-vs_002e-Characters.html
    | #. type: Plain text
    | #: archlinux debian-bullseye debian-unstable fedora-38 fedora-rawhide
    | #: mageia-cauldron opensuse-leap-15-5 opensuse-tumbleweed
    | msgid ""
    | "Within a bracket expression, a collating element (a character, a "
    | "multicharacter sequence that collates as if it were a single character, or a "
    | "collating-sequence name for either) enclosed in \"I<[.>\" and \"I<.]>\" "
    | "stands for the sequence of characters of that collating element. The "
    | "sequence is a single element of the bracket expression's list. A bracket " | "expression containing a multicharacter collating element can thus match more "
    | "than one character, for example, if the collating sequence includes a \"ch\" "
    | "collating element, then the RE \"I<[[.ch.]]*c>\" matches the first five "
    | "characters of \"chchcc\"."
    | msgstr ""
    | "Innerhalb eines Klammerausdrucks steht ein Zuordnungselement (ein Zeichen, " | "eine Multizeichensequenz,

    Besser ``Mehrzeichensequenz'' um die Verwechslung mit ``Multibyte''
    zu vermeiden.

    | das zuordnet, also ob es ein einzelnes Zeichen "

    ``... das so geordnet/einsortiert wird, als ob es ...''

    Geordnet und sortiert scheinen mir hier gleich gut zu sein.

    | "wäre oder ein Zuordnungs-Sequenzname für eines davon), das in »I<[.>« und "
    | "»I<.]>« eingeschlossen ist, für die Zeichensequenz des Zuordnungselements. "
    | "Die Sequenz ist ein einzelnes Element der Klammerausdruckliste.

    ``Die Sequenz gilt als einzelnes Element der Zeichenklasse.'' waere
    klarer und direkter. ;-) Wenn ``Zeichenklasse'' hier unerwuenscht
    ist, dann ``Klammerausdrucksliste'' (mit `s').

    | Eine "
    | "Klammerausdruckliste, die ein Multizeichen-Zuordnungselement enthält, kann "
    | "daher mit mehr als einem Zeichen übereinstimmen, falls beispielsweise die " | "Zuordnungssequenz ein Zuordnungslement »ch« enthält, dann stimmt der RA " | "»I<[[.ch.]]*c>« auf die ersten fünf Zeichen von »chchcc«."

    ``dann stimmt der ... mit den ... ueberein''


    | #. type: Plain text
    | #: archlinux debian-unstable fedora-38 fedora-rawhide mageia-cauldron
    | #: opensuse-tumbleweed
    | msgid ""
    | "Within a bracket expression, a collating element enclosed in \"I<[=>\" and " | "\"I<=]>\" is an equivalence class, standing for the sequences of characters "
    | "of all collating elements equivalent to that one, including itself. (If "
    | "there are no other equivalent collating elements, the treatment is as if the "
    | "enclosing delimiters were \"I<[.>\" and \"I<.]>\".) For example, if o and " | "\\(^o are the members of an equivalence class, then \"I<[[=o=]]>\", "
    | "\"I<[[=\\(^o=]]>\", and \"I<[o\\(^o]>\" are all synonymous. An equivalence "
    | "class may not\\*(dg be an endpoint of a range."
    | msgstr ""
    | "Innerhalb eines Klammerausdrucks ist ein in »I<[=>« und »I<=]>« "
    | "eingeschlossenes Zuordnungselement eine Äquivalenzklasse, die für eine "
    | "Abfolge von Zeichen aller Zuordnungselement steht, die äquivalent zu dieser "

    ``...elemente ... zu diesem''

    | "sind, einschließlich iher selbst.

    ``einschliesslich ihm selbst'' (gemeint ist das Zuordnungselement)

    | (Falls es keine anderen äquivalenten "
    | "Zuordnungselemente gibt, erfolgt die Behandlung also ob die Begrenzer »I<[."
    | ">« und »I<.]>« wären.) Falls beispielsweise o und \\(^o die Mitglieder einer "
    | "Äquivalenzklasse wären, dann wären »I<[[=o=]]>«, »I<[[=\\(^o=]]>« und "
    | "»I<[o\\(^o]>« alle synonym. Eine Äquivalenzklasse darf nicht\\(dg der "
    | "Endpunkt eines Bereichs sein."


    meillo

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)
  • From Helge Kreutzmann@21:1/5 to Christoph Brinkhaus on Thu May 4 19:50:01 2023
    This is a MIME-formatted message. If you see this text it means that your E-mail software does not support MIME-formatted messages.

    Hallo Christoph,
    On Tue, May 02, 2023 at 11:19:08AM +0200, Christoph Brinkhaus wrote:

    Zu dem gnu Link:



    Es wird also im weiteren Text "character" statt dem sperrigeren
    "collating elements" verwendet. In dem Sinne könnten wir statt einer sperrigen Übersetzung ebenfalls nur "Zeichen" schreiben.

    Was haltet ihr davon?

    Das mag für das Dokument, was ich zur Hintergrundinfo dabei gefügt
    hatte, gelten, in der Handbuchseite selbst halte ich es für keine gute Lösung, da hier das Konzept wiedererkennbar bleiben muss.

    Viele Grüße

    Helge

    --
    Dr. Helge Kreutzmann debian@helgefjell.de
    Dipl.-Phys. http://www.helgefjell.de/debian.php
    64bit GNU powered gpg signed mail preferred
    Help keep free software "libre": http://www.ffii.de/

    -----BEGIN PGP SIGNATURE-----

    iQIzBAABCAAdFiEEbZZfteMW0gNUynuwQbqlJmgq5nAFAmRT8BQACgkQQbqlJmgq 5nCkPA/8DvyQhEP2ewVGXOo8foTydVdLEZ7CXl4eAb1QUvgjqth1qVU/POx51x07 UrFY7SqNhQIc0ZS98OMNshYmjLw9mh4aT5wfR4YUOyPzEzjIBifE0mIiR9AtJMjA wLpKbq1sqDP7XPlb7fLYZE0sAYCdomO9/a1udXz/V1MXxmPwYJphyo122IjSDSXD BAkqA83jMGrQERJcv4nLWTK/O26COZRTj60+siBi/086yidP/qAQu4ib0xkxOqSE Qw7XIVok/H0BzojB85srM8dr4l8GuvWT/cI7bd+jBZD4ctci4fM90Iodzyryqx6M oqgDOm6z37dFFvuwgNoByXaqSnr8fA3P7CG5pR/MvFshjTU66Otfnn8DzeB1iRxx nCE+W3eVAjDlfoVSA8SyuVl2JyAJRCMGpU8p1JZ/tTRiF3ogOIYfrB5iTQpgR/R/ xUcYhhm4ECZyUxXRyueD+tj9lA4WyR1QNhAMitY6F6pLN3S0EFfeZfyB/Fb69wPC 3AVDTKfzcn6gEhdD5RcRYj+D5nOGxDFn+UN0fzOp4EG6EPnCJxQGBCmHJRnGVivW 9tgOJN1zaLh7drlXnWDidnR3KzIylqqxE7WZvip
  • From Helge Kreutzmann@21:1/5 to Christoph Brinkhaus on Thu May 4 20:00:01 2023
    This is a MIME-formatted message. If you see this text it means that your E-mail software does not support MIME-formatted messages.

    Hallo Christoph,
    On Wed, May 03, 2023 at 03:47:17PM +0200, Christoph Brinkhaus wrote:
    Am Tue, May 02, 2023 at 11:19:08AM +0200 schrieb Christoph Brinkhaus:
    Die Handbuchseite ist auch inhaltlich trickiger. Insbesondere das
    Konzept und die Übersetzung des Begriffs „collating element“ ist mir schwer gefallen. Im ersten Anlauf habe ich „Zuordnungselement“ genommen, aber Wikipedia gitb folgendes: https://en.wikipedia.org/wiki/Collation_(disambiguation)
    In library, information and computer science, collation is the process
    of assembling written information into a standard order.

    Das Konzept wird auch etwas (mehr) in https://www.gnu.org/software/gnulib/manual/html_node/Collating-Elements-vs_002e-Characters.html
    erklärt.

    Daher überlege ich, ggf. „Sortierelement“ zu verwenden.

    Der Hinweis bezieht sich auf die deutschen Uebersetzung des
    Standardwerks von Friedl.

    Kannst Du das genauer Referenzieren? Wenn es eine etablierte Standardübersetzung gibt, wäre die als Referenz nicht schlecht.

    Dort wird folgenderemassen übersetzt:
    „collating element“ : Kollationselement
    „collating sequence“ : Kollationssequenz

    Weil ich die Begriffe noch nie gelesen oder gehört habe habe ich
    zusätzlich gesucht und folgendes gefunden:

    Die Begriffe werden im Wörterbuch wie unten genauso übersetzt: https://glosbe.com/en/de/collation%20sequence

    Leo hat als eine mögliche Übersetzung:
    to collate sth. etw. kollationieren

    Kollationselement wird auch in einer deutschen Übersetzung der Tcl/Tk Dokumentation verwendet. https://runebook.dev/de/docs/tcl_tk/tclcmd/re_syntax.htm

    Beide Begriffe werden in einer _schwedischen_ po Vorlage werwendet: https://sources.debian.org/data/main/g/glibc/2.28-8/po/sv.po

    Nun, wie das in einer Drittsprache gehandhabt wird, würde ich nicht
    als wesentliches Argument sehen.

    Das scheint also zu passen. Wie ist eure Meinung?

    Vorteil: „Jeder“ stolpert drüber und erkennt, dass das ein besonderes Konzept ist und sucht eine Erklärung.

    Nachteil: Der Begriff ist alles andere als selbsterklärend, was ich
    mit „Sortierelement“ überlegt habe.

    Mal sehen, was Markus vorgeschlagen hat…

    Viele Grüße

    Helge

    --
    Dr. Helge Kreutzmann debian@helgefjell.de
    Dipl.-Phys. http://www.helgefjell.de/debian.php
    64bit GNU powered gpg signed mail preferred
    Help keep free software "libre": http://www.ffii.de/

    -----BEGIN PGP SIGNATURE-----

    iQIzBAABCAAdFiEEbZZfteMW0gNUynuwQbqlJmgq5nAFAmRT8SYACgkQQbqlJmgq 5nA3Kg/9FuIPrtxO4e7DrIM/pMHspMhypNjaVgI2smnECDjD5jD4ONDNdJ0vDJ3+ T/f5MgwC1ooof+axCz/fxmf/YEORhRUbLsb/THa66bc7EkYrFLJ/HFySDyG9Wv3c 3K9F6j4mg8lp0sgygCtoui+5HDI8iZmRAKHZ2vPOCic/WmIRuu/vxXeGhzSHrtMJ lMV+kYmGKDWHiceLzIRNF7slnV5P8lVZOwPQOocvR7QmQsd3IgrO+vzT3cM4Nw1X aNnNViziEGJS5ETYNJvl9ECw7IO3VyARpZT4G5KBlXp5jm/k1pRjyVQ3We1X5u+u cOIHpxMJFHN02mia5TOriUsP+Pk7Q8nzgwjZNH+/elocweKzOZRufWnO3F5b9bYc ZdeFu6IBW2OFDjz5ceZXJRifeqimYKHjJ9/FitWFhCGbe9flL6uMw6Bxeo6J5BOO HpiY7sdHmwME/iT1B9K1XDbdr2SgST76IYtwUDHKdp0llb8hVruHUQzMWJFZhvdU GLt3viMlpKnKuembr+0qYDCx6iO0IIaaTakZBMjt/4Dzk43cb6tFlPU7Z0X2dAwf j+5Hgwqo3QbOAPsitrfTCDB5pE0xkMeYrCZ4RF8
  • From Christoph Brinkhaus@21:1/5 to All on Thu May 4 20:40:02 2023
    Am Thu, May 04, 2023 at 07:53:42PM +0200 schrieb Helge Kreutzmann:
    Hallo Helge,

    Hallo Christoph,

    [...]

    Der Hinweis bezieht sich auf die deutschen Uebersetzung des
    Standardwerks von Friedl.

    Kannst Du das genauer Referenzieren? Wenn es eine etablierte Standardübersetzung gibt, wäre die als Referenz nicht schlecht.

    Vermutlich ist es das Buch:
    http://regex.info/book.html

    [...]

    Mal sehen, was Markus vorgeschlagen hat…

    Das sehe ich auch so.

    Viele Grüße,
    Christoph

    -----BEGIN PGP SIGNATURE-----

    iQGzBAABCgAdFiEEj7zWuLpAjGEt2B3aIXCAe2OOngIFAmRT+c8ACgkQIXCAe2OO ngK27gv+Kzkzij3mr1l+qveKoUQPUnayJvQcc6yzgQhKKgAMFyd03TVk7DLf/EjP cG78k84ytVmDFVxBg+5mVIQ7W9fj2fkt8T7MmdCKFk3PXKaZBJyDX8NtdRxyWvCj rsKhakNMR/e0rQBA2yTll9hyxsYIcX/Qh3Gtq31kbXzZMgOgBH5evfGWe+0D9ktZ J9+MjJNsGsRmS/95mRRWK1h+RgQ9BjeLEPiteIDFs1356fdAr5oFAVVihfQbwnuM k/AvpxxRAMndWnszeftTVXCKadnn/aXuewSZYzGsvmNiI2OdYUv1Jle5p2gHxGKv pI9ksxS8X+W43nY+HeEKcVum18l+kQ7aZga6A2VI8RZl78SZFpJ0CMbklzh5SKUk QGckNxp484inkPF5yf7nh0ItbIIAbcJ1Aj2GK72Tl8tEx4P+1UV9DzJBoYrZcc0O KLvWk7Ab0O4ZuxcWETB2OZUKCwIOxWOa82DYgcdTdhTLsYqLBnm+HM3MnWhMmf0Q
    N+J/6ttW
    =cA0s
    -----END PGP SIGNATURE-----

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)
  • From Helge Kreutzmann@21:1/5 to markus schnalke on Thu May 4 21:50:01 2023
    This is a MIME-formatted message. If you see this text it means that your E-mail software does not support MIME-formatted messages.

    Hallo Markus,
    On Wed, May 03, 2023 at 04:52:04PM +0200, markus schnalke wrote:
    ich bin auf diese Diskussion aufmerksam gemacht worden. Zwar habe
    ich nicht viel Erfahrung mit Uebersetzungen, aber ich kenne mich
    mit REs gut aus, darum will ich versuchen, bei dieser ja doch recht schwierigen Uebersetzung zu unterstuetzen. Ich hoffe, dass meine
    Kommentare und Vorschlaege die Arbeit erleichtern.

    Ganz herzlichen Dank. REs nutze ich gerne und viel (außer diese Kollations…), daher hatte ich mir die Seite jetzt auch vorgenommen. Es
    ist gut, das Du als fachlich involvierter das gegenliest.

    [2023-05-03 15:47] Christoph Brinkhaus <c.brinkhaus@t-online.de>

    Am Tue, May 02, 2023 at 11:19:08AM +0200 schrieb Christoph Brinkhaus:
    Am Sun, Apr 30, 2023 at 07:03:06PM +0200 schrieb Helge Kreutzmann:

    Nochmal Hallo,

    die Zeilen von meinem letzten Beitrag weiter unten habe ich gelöscht.
    Ich habe einen Vorschlag bekommen, den ich unten Vorstelle.

    [...]

    Die Handbuchseite ist auch inhaltlich trickiger. Insbesondere das Konzept und die Übersetzung des Begriffs „collating element“ ist mir
    schwer gefallen. Im ersten Anlauf habe ich „Zuordnungselement“ genommen, aber Wikipedia gitb folgendes: https://en.wikipedia.org/wiki/Collation_(disambiguation)
    In library, information and computer science, collation is the process of assembling written information into a standard order.

    Das Konzept wird auch etwas (mehr) in https://www.gnu.org/software/gnulib/manual/html_node/Collating-Elements-vs_002e-Characters.html
    erklärt.

    Daher überlege ich, ggf. „Sortierelement“ zu verwenden.

    Der Hinweis bezieht sich auf die deutschen Uebersetzung des
    Standardwerks von Friedl.

    Dort wird folgenderemassen übersetzt:
    „collating element“ : Kollationselement
    „collating sequence“ : Kollationssequenz

    Weil ich die Begriffe noch nie gelesen oder gehört habe habe ich zusätzlich gesucht und folgendes gefunden:

    Die Begriffe werden im Wörterbuch wie unten genauso übersetzt: https://glosbe.com/en/de/collation%20sequence

    Kollationselement wird auch in einer deutschen Übersetzung der Tcl/Tk Dokumentation verwendet. https://runebook.dev/de/docs/tcl_tk/tclcmd/re_syntax.htm

    Beide Begriffe werden in einer _schwedischen_ po Vorlage werwendet: https://sources.debian.org/data/main/g/glibc/2.28-8/po/sv.po

    #: locale/programs/ld-collate.c:441
    #, c-format
    msgid "`%.*s' already defined as collating symbol"
    msgstr "\"%.*s\" redan definierad som ett kollationssymbol"

    #: locale/programs/ld-collate.c:448
    #, c-format
    msgid "`%.*s' already defined as collating element"
    msgstr "\"%.*s\" redan definierad som ett kollationselement"

    Das scheint also zu passen. Wie ist eure Meinung?

    Eine wirklich gute, also sowohl inhaltlich treffende als auch
    begriffsnahe, Uebersetzung kenne ich nicht. Collation ist die Sortierreihenfolge/Sortierordnung, also z.B. dass `ä' nach `a'
    kommt.

    Genau so ein Satz fehlt in der Handbuchseite. Das werde ich im Rahmen
    meiner routinemäßigen Meldung an die Originalautoren auch vorschlagen,
    so etwas zu ergänzen. Dann könnte auch der Begriff bleiben, weil er
    mit Erläuterung eingeführt wurde.

    Ich denke, man muss sich entscheiden, ob man eher wortnaeher
    uebersetzt (also fuer eine Person, die vielleicht nur ein bisschen
    Englisch kann und sich ueber den deutschen Text das englische
    Original erschliesst) oder ob die Uebersetzung moeglichst fluessig
    deutsch klingen soll. Da es sich hier um eine moeglichst exakte
    technische Zusammenfassung der RE-Definition von POSIX handelt,
    wuerde ich wohl eher zu ersterem tendieren. Laien werden die Seite
    kaum lesen und Profis werden moeglichst viel Uebereinstimmung mit
    dem englischen Original wuenschen, denke ich mir.

    Ja, die erste Zielgruppe wäre auch meine Präferenz.

    Hier nun allerlei Kommentare, zu verschiedenen Stellen. Sie sind
    IMO nicht vollstaendig in sich stimmig. Dazu muesste man dann den
    gesamten Text nochmal am Stueck lesen, ob er stimmig wirkt.

    Kein Problem, diese Handbuchseite wird 4x umgedreht. Ich selber habe
    ihr auch schon einen zusätzlichen internen Lauf gegeben und kann das
    gerne am Ende auch noch mal machen.

    | # FIXME I<egrep> → B<egrep>(1)
    | #. type: Plain text
    | #: archlinux debian-bullseye debian-unstable fedora-38 fedora-rawhide
    | #: mageia-cauldron opensuse-leap-15-5 opensuse-tumbleweed
    | msgid ""
    | "Regular expressions (\"RE\"s), as defined in POSIX.2, come in two forms: " | "modern REs (roughly those of I<egrep>; POSIX.2 calls these \"extended\" " | "REs) and obsolete REs (roughly those of B<ed>(1); POSIX.2 \"basic\" REs). "
    | "Obsolete REs mostly exist for backward compatibility in some old programs; "
    | "they will be discussed at the end. POSIX.2 leaves some aspects of RE syntax "
    | "and semantics open; \"\\*(dg\" marks decisions on these aspects that may not "
    | "be fully portable to other POSIX.2 implementations."
    | msgstr ""
    | "Reguläre Ausdrücke (»RA«), wie sie in POSIX.2 definiert sind, kommen in zwei "
    | "Formen:

    Vorschlag: ``gibt es in zwei Arten''

    Übernommen.

    | #. type: Plain text
    | #: archlinux debian-unstable fedora-38 fedora-rawhide mageia-cauldron
    | msgid ""
    | "A piece is an I<atom> possibly followed by a single\\*(dg \\[aq]*\\[aq], " | "\\[aq]+\\[aq], \\[aq]?\\[aq], or I<bound>. An atom followed by "
    | "\\[aq]*\\[aq] matches a sequence of 0 or more matches of the atom. An atom "
    | "followed by \\[aq]+\\[aq] matches a sequence of 1 or more matches of the " | "atom. An atom followed by \\[aq]?\\[aq] matches a sequence of 0 or 1 "
    | "matches of the atom."
    | msgstr ""
    | "Ein Stück ist ein I<Atom>, möglicherweise gefolgt von einem einzelnen\\(dg "
    | "»*«, »+«, »?« oder einer I<Begrenzung>.

    ``Beschraenkung'' finde ich hier etwas treffender, finde ich, weil es
    hierbei um eine beschraenkte Anzahl von Wiederholungen geht. (Muss
    dann natuerlich auch im weiteren Text geaendert werden.)

    Habe ich (global) übernommen.

    | Ein Atom, auf das ein »*« folgt, "
    | "stimmt mit einer Sequenz von 0 oder mehr Übereinstimmungen mit diesem Atom "
    | "überein. Ein Atom, auf das ein »+« folgt, stimmt mit einer Sequenz von 1 "
    | "oder mehr Übereinstimmungen mit diesem Atom überein. Ein Atom, auf das ein "
    | "»?« folgt, stimmt mit einer Sequenz von 0 oder 1 Übereinstimmungen mit "
    | "diesem Atom überein."
    |
    | #. type: Plain text
    | #: archlinux debian-unstable fedora-38 fedora-rawhide mageia-cauldron
    | msgid ""
    | "A I<bound> is \\[aq]{\\[aq] followed by an unsigned decimal integer, "
    | "possibly followed by \\[aq],\\[aq] possibly followed by another unsigned " | "decimal integer, always followed by \\[aq]}\\[aq]. The integers must lie "
    | "between 0 and B<RE_DUP_MAX> (255\\*(dg) inclusive, and if there are two of "
    | "them, the first may not exceed the second. An atom followed by a bound " | "containing one integer I<i> and no comma matches a sequence of exactly I<i> "
    | "matches of the atom. An atom followed by a bound containing one integer " | "I<i> and a comma matches a sequence of I<i> or more matches of the atom. An "
    | "atom followed by a bound containing two integers I<i> and I<j> matches a " | "sequence of I<i> through I<j> (inclusive) matches of the atom."
    | msgstr ""
    | "Eine I<Begrenzung> ist »{« gefolgt von einer vorzeichenlosen Dezimalzahl, "

    Hier fehlt die Ganzzahligkeit. Am korrektesten waere wohl:
    ``vorzeichenlose Ganzzahl in Dezimaldarstellung''.

    ``Dezimalzahl'' waere missverstaendlich, denn siehe:

    Unter einer Dezimalzahl versteht man

    - Eine Zahl im Dezimalsystem, das als Basis die Zahl 10 verwendet
    - Eine in „Kommaschreibweise“ geschriebene Kommazahl, also 0,5
    statt 1⁄2 – siehe Nachkommastelle

    https://de.wikipedia.org/wiki/Dezimalzahl

    Ok, das hätte ich nicht so angenommen. Aber ich übernehme das
    (global).

    | "möglicherweise gefolgt von »,«, möglicherweise gefolgt von einer weiteren "
    | "vorzeichenlosen Dezimalzahl, immer gefolgt von »}«. Die ganzen Zahlen müssen "
    | "zwischen 0 und B<RE_DUP_MAX> (255\\(dg) einschließlich liegen und falls es "
    | "davon zwei gibt, darf die erste die zweite nicht übersteigen.

    ``... darf die erste nicht groesser als die zweite sein.''
    (einfachere Sprache)

    Mit korrekten deutschen Zeichen übernommen.

    | #. type: Plain text
    | #: archlinux debian-unstable fedora-38 fedora-rawhide mageia-cauldron
    | msgid ""
    | "An atom is a regular expression enclosed in \"I<()>\" (matching a match for "
    | "the regular expression), an empty set of \"I<()>\" (matching the null "
    | "string)\\*(dg, a I<bracket expression> (see below), \\[aq].\\[aq] (matching "
    | "any single character), \\[aq]\\[ha]\\[aq] (matching the null string at the "
    | "beginning of a line), \\[aq]$\\[aq] (matching the null string at the end of "
    | "a line), a \\[aq]\\e\\[aq] followed by one of the characters \"I<\\[ha].[$()|"
    | "*+?{\\e>\" (matching that character taken as an ordinary character), a "
    | "\\[aq]\\e\\[aq] followed by any other character\\*(dg (matching that "
    | "character taken as an ordinary character, as if the \\[aq]\\e\\[aq] had not "
    | "been present\\*(dg), or a single character with no other significance "
    | "(matching that character). A \\[aq]{\\[aq] followed by a character other "
    | "than a digit is an ordinary character, not the beginning of a bound\\*(dg. "
    | "It is illegal to end an RE with \\[aq]\\e\\[aq]."
    | msgstr ""
    | "Ein Atom ist ein regulärer Ausdruck, der in »I<()>« eingeschlossen ist (der "
    | "eine Übereinstimmung mit dem regulären Ausdruck darstellt), eine leere Menge "
    | "aus »I<()>« (der mit der leeren Zeichenkette übereinstimmt)\\(dg, ein " | "I<Klammerausdruck> (siehe unten),

    ``Klammerausdruck'' ist etwas unguenstig im Deutschen. Im
    Englischen gibt es drei verschiedene Begriffe fuer die drei
    Klammerarten: parentheses (), brackets [], braces {}. Im Deutschen
    bezeichnet Klammern alle drei. Ich denke, da ``Klammerausdruck''
    uneindeutig ist, wird in der deutschen Uebersetzung von Friedls
    ``Regulaere Ausdruecke'' (O'Reilly) fuer ``bracket expression'' die
    etwas ungenaue aber pragmatischere hilfreichere Bezeichnung
    ``Zeichenklasse'' verwendet. Aus meiner Sicht kann man beide Wege
    gehen. Ich wollte es vor allem der Vollstaendigkeit halber
    erwaehnen.

    Dann lasse ich es so, den das wird im nächsten Absatz ja explizit
    definiert. Und „Zeichenklasse“ finde ich wiederum sehr weit vom
    Original.

    | #. type: Plain text
    | #: archlinux debian-unstable fedora-38 fedora-rawhide mageia-cauldron
    | msgid ""
    | "A I<bracket expression> is a list of characters enclosed in \"I<[]>\". It "
    | "normally matches any single character from the list (but see below). If the "
    | "list begins with \\[aq]\\[ha]\\[aq], it matches any single character (but "
    | "see below) I<not> from the rest of the list. If two characters in the list "
    | "are separated by \\[aq]-\\[aq], this is shorthand for the full I<range> of "
    | "characters between those two (inclusive) in the collating sequence, for " | "example, \"I<[0-9]>\" in ASCII matches any decimal digit. It is "
    | "illegal\\*(dg for two ranges to share an endpoint, for example, \"I<a-c-" | "e>\". Ranges are very collating-sequence-dependent, and portable programs "
    | "should avoid relying on them."
    | msgstr ""
    | "Ein I<Klammerausdruck> ist eine Liste von Zeichen, die in »I<[]>« "
    | "eingeschlossen sind. Er stimmt normalerweise mit einem einzelnen Zeichen aus "
    | "der Liste überein (siehe aber nachfolgend). Falls die Liste mit einem "
    | "»\\[ha]« beginnt, stimmt er mit jedem einzelnen Zeichen (siehe aber "
    | "nachfolgend) überein, das I<nicht> in der Liste ist. Falls zwei Zeichen in "
    | "der Liste durch ein »-« getrennt sind, ist dies eine Abkürzung für den "
    | "vollständigen I<Bereich> der Zeichen zwischen diesen zwei (einschließlich) "

    Besser ``den ganzen Bereich'' statt ``den vollstaendigen Bereich''.

    Übernommen.

    | "in der Zuordnungssequenz,

    Ich wuerde hier ``Sortierordnung'' schreiben, denn das ist es was
    inhaltlich gemeint ist. (Das betrifft weitere Stellen im Text.)

    Ok, dann hätten wir das geklärt. Global übernommen.

    | beispielsweise stimmt »I<[0-9]>« in ASCII mit "
    | "jeder dezimale Ziffer überein.

    ``dezimalen'' (mit `n')

    Global übernommen.

    | Es ist verboten\\(dg, dass zwei Bereiche den "
    | "gleichen Endpunkt haben, beispielsweise »I<a-c-e>«. Bereiche hängen stark "
    | "von der Zuordnungssequenz ab und portierbare Programme sollten vermeiden, "
    | "davon abzuhängen."

    | # FIXME Collating eher Sortieren statt Zuordnen
    | # https://www.gnu.org/software/gnulib/manual/html_node/Collating-Elements-vs_002e-Characters.html
    | #. type: Plain text
    | #: archlinux debian-bullseye debian-unstable fedora-38 fedora-rawhide
    | #: mageia-cauldron opensuse-leap-15-5 opensuse-tumbleweed
    | msgid ""
    | "Within a bracket expression, a collating element (a character, a "
    | "multicharacter sequence that collates as if it were a single character, or a "
    | "collating-sequence name for either) enclosed in \"I<[.>\" and \"I<.]>\" " | "stands for the sequence of characters of that collating element. The "
    | "sequence is a single element of the bracket expression's list. A bracket "
    | "expression containing a multicharacter collating element can thus match more "
    | "than one character, for example, if the collating sequence includes a \"ch\" "
    | "collating element, then the RE \"I<[[.ch.]]*c>\" matches the first five " | "characters of \"chchcc\"."
    | msgstr ""
    | "Innerhalb eines Klammerausdrucks steht ein Zuordnungselement (ein Zeichen, "
    | "eine Multizeichensequenz,

    Besser ``Mehrzeichensequenz'' um die Verwechslung mit ``Multibyte''
    zu vermeiden.

    Global übernommen.

    | das zuordnet, also ob es ein einzelnes Zeichen "

    ``... das so geordnet/einsortiert wird, als ob es ...''

    „einsortiert“ genommen

    Geordnet und sortiert scheinen mir hier gleich gut zu sein.

    | "wäre oder ein Zuordnungs-Sequenzname für eines davon), das in »I<[.>« und "
    | "»I<.]>« eingeschlossen ist, für die Zeichensequenz des Zuordnungselements. "
    | "Die Sequenz ist ein einzelnes Element der Klammerausdruckliste.

    ``Die Sequenz gilt als einzelnes Element der Zeichenklasse.'' waere
    klarer und direkter. ;-) Wenn ``Zeichenklasse'' hier unerwuenscht
    ist, dann ``Klammerausdrucksliste'' (mit `s').

    „s“ entsprechend ergänzt (mehrfach)

    | Eine "
    | "Klammerausdruckliste, die ein Multizeichen-Zuordnungselement enthält, kann "
    | "daher mit mehr als einem Zeichen übereinstimmen, falls beispielsweise die "
    | "Zuordnungssequenz ein Zuordnungslement »ch« enthält, dann stimmt der RA "
    | "»I<[[.ch.]]*c>« auf die ersten fünf Zeichen von »chchcc«."

    ``dann stimmt der ... mit den ... ueberein''

    Übernommen.

    | #. type: Plain text
    | #: archlinux debian-unstable fedora-38 fedora-rawhide mageia-cauldron
    | #: opensuse-tumbleweed
    | msgid ""
    | "Within a bracket expression, a collating element enclosed in \"I<[=>\" and "
    | "\"I<=]>\" is an equivalence class, standing for the sequences of characters "
    | "of all collating elements equivalent to that one, including itself. (If " | "there are no other equivalent collating elements, the treatment is as if the "
    | "enclosing delimiters were \"I<[.>\" and \"I<.]>\".) For example, if o and "
    | "\\(^o are the members of an equivalence class, then \"I<[[=o=]]>\", "
    | "\"I<[[=\\(^o=]]>\", and \"I<[o\\(^o]>\" are all synonymous. An equivalence "
    | "class may not\\*(dg be an endpoint of a range."
    | msgstr ""
    | "Innerhalb eines Klammerausdrucks ist ein in »I<[=>« und »I<=]>« "
    | "eingeschlossenes Zuordnungselement eine Äquivalenzklasse, die für eine " | "Abfolge von Zeichen aller Zuordnungselement steht, die äquivalent zu dieser "

    ``...elemente ... zu diesem''

    Korrigiert.

    | "sind, einschließlich iher selbst.

    ``einschliesslich ihm selbst'' (gemeint ist das Zuordnungselement)

    Korrigiert.

    | (Falls es keine anderen äquivalenten "
    | "Zuordnungselemente gibt, erfolgt die Behandlung also ob die Begrenzer »I<[."
    | ">« und »I<.]>« wären.) Falls beispielsweise o und \\(^o die Mitglieder einer "
    | "Äquivalenzklasse wären, dann wären »I<[[=o=]]>«, »I<[[=\\(^o=]]>« und "
    | "»I<[o\\(^o]>« alle synonym. Eine Äquivalenzklasse darf nicht\\(dg der " | "Endpunkt eines Bereichs sein."

    Ganz herzlichen Dank fürs Korrekturlesen!

    Viele Grüße

    Helge

    --
    Dr. Helge Kreutzmann debian@helgefjell.de
    Dipl.-Phys. http://www.helgefjell.de/debian.php
    64bit GNU powered gpg signed mail preferred
    Help keep free software "libre": http://www.ffii.de/

    -----BEGIN PGP SIGNATURE-----

    iQIzBAABCAAdFiEEbZZfteMW0gNUynuwQbqlJmgq5nAFAmRUDDoACgkQQbqlJmgq 5nBhfA//b9e5gwQNtRsfhEDO20reBLjk3kbOmy39lOH3BjXBbMBefFLqROPu7elT Ped3F97QTBvzgU+ynZyvrXHdMbfXKQ1HILa35Bj707pbSmO9hKXGhVWR/AhZfIIS QUH5Bgai3bKUmSn8I0eRhPWgIUjxW/4wdyykyHUnBTc1NLVw8oEGpa3fYGAZCysG AwV2z0Tghqf+kf60SStwR5iVhUjeJiw91ZOm81Ahc+NLyawbadVY9pRq8nmBU3lO TombPL/JFIrO33opJCFiUocEmD2POWSBQ28BruL7tQRa6YffM94YRfSEHBb7Ju4k SBlL5v6xpCVpI8sawiSSFxCofV8LvPbT/DvB26/IccgqQQfGW0nNRmaNdd+W4xFA a37uiUYSdquRVFMLOfF1mc9xtH9Km34N2bu1Q3iQDBjGCyDbVvYpLsSGFU7GepvE jheH6AeZxmfoWALoG7ImVaX4C+lgtADv3IxSKoozjRJpVs9EDdA3KmOdZ7YTUkhq F03/sEt/ZDlQMJ7oS/cpOXqAnIWnAY7qCh1JWAj1dJdTP6EJnT8B3OYaFRZt/+Ft b/Q9BKx+ptQJzyXpMwfG/GGHlOH8v4GmuxB5JKY
  • From Helge Kreutzmann@21:1/5 to All on Thu May 4 22:00:01 2023
    This is a MIME-formatted message. If you see this text it means that your E-mail software does not support MIME-formatted messages.

    --8/pVXlBMPtxfSuJG
    Content-Type: text/plain; charset=utf-8
    Content-Disposition: inline
    Content-Transfer-Encoding: quoted-printable

    Hallo Markus,
    hallo Mitübersetzer,
    ich habe kürzlich eine Handbuchseite aus Abschnitt 7 übersetzt.

    Es sind insgesamt 47 Zeichenketten, nicht ganz gleichmäßig auf
    zwei Teile aufgeteilt.

    Für konstruktives Korrekturlesen wäre ich sehr dankbar.

    Viele Grüße

    Helge

    --
    Dr. Helge Kreutzmann debian@helgefjell.de
    Dipl.-Phys. http://www.helgefjell.de/debian.php
    64bit GNU powered gpg signed mail preferred
    Help keep free software "libre": http://www.ffii.de/

    --8/pVXlBMPtxfSuJG
    Content-Type: text/plain; charset=utf-8
    Content-Disposition: attachment; filename="regex.7.2.po" Content-Transfer-Encoding: quoted-printable


    #. type: Plain text
    #: archlinux debian-bullseye debian-unstable fedora-38 fedora-rawhide
    #: mageia-cauldron opensuse-leap-15-5 opensuse-tumbleweed
    msgid ""
    "Within a bracket expression, the name of a I<character class> enclosed in " "\"I<[:>\" and \"I<:]>\" stands for the list of all characters belonging to " "that class. Standard character class names are:"
    msgstr ""
    "Innerhalb eines Klammerausdrucks steht der Name einer I<Zeichenklasse>, " "eingeschlossen in »I<[:>« und »I<:]>«, für eine Liste aller Zeichen, die zu "
    "der Klasse gehören.
  • From markus schnalke@21:1/5 to All on Thu May 4 22:00:02 2023
    Hoi.

    [2023-05-04 20:30] Christoph Brinkhaus <c.brinkhaus@t-online.de>
    Am Thu, May 04, 2023 at 07:53:42PM +0200 schrieb Helge Kreutzmann:

    Der Hinweis bezieht sich auf die deutschen Uebersetzung des
    Standardwerks von Friedl.

    Kannst Du das genauer Referenzieren? Wenn es eine etablierte Standardübersetzung gibt, wäre die als Referenz nicht schlecht.

    Vermutlich ist es das Buch:
    http://regex.info/book.html

    Genau.

    Aus meiner Sicht ist es ein Standardwerk. Ich kenne jedenfalls kein
    bekannteres oder besseres Buch zum Thema. Das Buch ist fuer
    Programmierer geschrieben, die verstehen wollen, wie REs
    funktionieren, ohne dabei aber in die Sprachtheorie oder
    POSIX-Definitionen abzutauchen. Alles was in der Manpage steht,
    kommt im Buch auch vor (plus viel mehr, weil es auch REs ausserhalb
    der POSIX-Definition abdeckt). Das Buch ist weniger abstrakt
    geschrieben als die Manpage.


    Hier was ich Christoph, auf seine Anfrage bei mir, zuvor schon
    off-list geschrieben hatte:

    - bracket expression -- Zeichenklasse

    - [a-z] -- normale Klassen

    - [[:alpha:]] -- POSIX-Klammerausdruck ``Zeichenklasse'' (``Was wir
    hier Zeichenklasse nennen, heisst bei POSIX Klammerausdruck.'' Und:
    ``Im allgemeinen verwende ich in diesem Buch die Begriffe
    `Zeichenklasse' und `POSIX-Klammerausdruck' synonym fuer das ganze
    Konstrukt. `POSIX-Zeichenklasse' bezieht sich dagegen auf die
    spezielle Art von Bereichen, wie sie hier besprochen werden.'')

    - [[.span-ll.]] -- POSIX-Klammerausdruck ``Kollationssequenz''

    - [[=n=]] -- POSIX-Klammerausdruck ``Zeichenaequivalent''

    Das sind die jeweiligen Ueberschriften zu den verschiedenen Bracket
    Expressions plus ein paar Erklaerungen aus dem Buch.

    Ich habe die deutsche Uebersetzung des Buches vorliegen. Ich kann
    gerne darin noch mehr Dinge nachschauen, wenn das hilft.

    Man sieht, dass die Uebersetzer des Buches mit der Bracket
    Expression auch zu kaempfen hatten.

    Als Unterschied zwischen Manpage und Buch sehe ich, dass das Buch
    pragmatischer ist (darum der Begriff ``Zeichenklasse'' fuer die
    Bracket Expression), waehrend die Manpage eine RE-Definition
    abbildet und folglich exakter sein sollte.


    Hoffentlich mache ich euch die Arbeit nicht schwerer, indem ich zu
    tief in das Thema eintauche. (Es ist schon gut, dass nicht die
    Fachidioten uebersetzen. :-D ) Am besten ihr fragt mich, was ihr
    wissen wollt und ich lese mir das Ergebnis nochmal durch, ob es
    inhaltlich zutreffend und verstaendlich ist.


    meillo

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)
  • From Helge Kreutzmann@21:1/5 to markus schnalke on Thu May 4 22:00:03 2023
    This is a MIME-formatted message. If you see this text it means that your E-mail software does not support MIME-formatted messages.

    Hallo Markus,
    On Thu, May 04, 2023 at 09:50:05PM +0200, markus schnalke wrote:
    [2023-05-04 20:30] Christoph Brinkhaus <c.brinkhaus@t-online.de>
    Am Thu, May 04, 2023 at 07:53:42PM +0200 schrieb Helge Kreutzmann:

    Der Hinweis bezieht sich auf die deutschen Uebersetzung des Standardwerks von Friedl.

    Kannst Du das genauer Referenzieren? Wenn es eine etablierte Standardübersetzung gibt, wäre die als Referenz nicht schlecht.

    Vermutlich ist es das Buch:
    http://regex.info/book.html

    Genau.

    Danke.

    Als Unterschied zwischen Manpage und Buch sehe ich, dass das Buch pragmatischer ist (darum der Begriff ``Zeichenklasse'' fuer die
    Bracket Expression), waehrend die Manpage eine RE-Definition
    abbildet und folglich exakter sein sollte.

    Sehe ich auch so.

    Hoffentlich mache ich euch die Arbeit nicht schwerer, indem ich zu
    tief in das Thema eintauche. (Es ist schon gut, dass nicht die
    Fachidioten uebersetzen. :-D ) Am besten ihr fragt mich, was ihr
    wissen wollt und ich lese mir das Ergebnis nochmal durch, ob es
    inhaltlich zutreffend und verstaendlich ist.

    Ganz im Gegenteil, das hilft *sehr*.

    Teil 2 kommt auch gleich, vielleicht hast Du dafür auch noch Zeit?

    Viele Grüße

    Helge

    --
    Dr. Helge Kreutzmann debian@helgefjell.de
    Dipl.-Phys. http://www.helgefjell.de/debian.php
    64bit GNU powered gpg signed mail preferred
    Help keep free software "libre": http://www.ffii.de/

    -----BEGIN PGP SIGNATURE-----

    iQIzBAABCAAdFiEEbZZfteMW0gNUynuwQbqlJmgq5nAFAmRUDR8ACgkQQbqlJmgq 5nByMg//Sq8I8qBnNI0/8CAifi9LsIC4LQDvLsKE0KBv56HJluu5Q9vry4+pYiOK HQ8LD0qN0N1VVcOVDoEQcj/ZVfZIPRo5Pzyfbev+vrp1RSDzSGAWFQxkCMgL1wDS gawSF0kYZr1HQ2rWc0x8NPC2ShbHRFipWCkpAaeQOizmTuLTyxDk8xM7D626n/tI wg65i4rvvBHqCRlCCs072AZMI58lFv+1KssR4uIhKocTR60V3m/5A1vHGDa/IhqV NCfrEiEFZLZ6HzBHaKd4hEafQHnvS/5twtJVRMrVNWoVqaz2IjDc+TzvF1H8J+rH HQIpaljqhjOkCNQPJxZ2zwRGIm148RY2qUZxzqzPA2wUPB7NJ/WlnhpyD2gL5zXK 6rLUreXTwJOVvX9BitfL2/6DDa6GDht2kOE8IYqpgdNaxoIcYuuD2eJgJuA3nPr4 kmQdq1hrASm+W+xLBmdt5QXsY3VaBT6zdvOlnEbHpISdG5Nv1rlIw7X0VJN2RFiJ 6bmmWSTVGaKyJG7JkpVcYV5Bx3Q2TwWGqHpblisT4bUMWVUtCky3B/1xrFc/+EbO cKMFVdwsK/M5DX0OxBVFInpe94VqTXzudM73ZKS
  • From markus schnalke@21:1/5 to All on Fri May 5 09:30:01 2023
    Hoi.

    Hier meine Anmerkungen zu Teil 2.

    [2023-05-04 21:54] Helge Kreutzmann <debian@helgefjell.de>

    #. type: Plain text
    #: archlinux debian-bullseye debian-unstable fedora-38 fedora-rawhide
    #: mageia-cauldron opensuse-leap-15-5 opensuse-tumbleweed
    msgid ""
    "These stand for the character classes defined in B<wctype>(3). A locale may "
    "provide others. A character class may not be used as an endpoint of a range."
    msgstr ""
    "Diese stehen für die in B<wctype>(3) definierten Zeichenklassen. Eine Locale "

    Ist ``die Locale'' ueblich? Ich haette ``das Locale'' gesagt. Es
    sollte halt zu den anderen Manpages passen.

    "könnte andere bereitstellen. Eine Zeichenklasse darf nicht als Endpunkte "

    ``Endpunkt'' (Einzahl)

    "eines Bereichs verwandt werden."

    #. type: Plain text
    #: archlinux debian-bullseye debian-unstable fedora-38 fedora-rawhide
    #: mageia-cauldron opensuse-leap-15-5 opensuse-tumbleweed
    msgid ""
    "In the event that an RE could match more than one substring of a given " "string, the RE matches the one starting earliest in the string. If the RE " "could match more than one substring starting at that point, it matches the " "longest. Subexpressions also match the longest possible substrings, subject "
    "to the constraint that the whole match be as long as possible, with " "subexpressions starting earlier in the RE taking priority over ones starting "
    "later. Note that higher-level subexpressions thus take priority over their "
    "lower-level component subexpressions."
    msgstr ""
    "Falls ein RA mit mehr als einer Teilzeichenkette einer gegebenen " "Zeichenkette übereinstimmen könnte, passt der RA auf die Teilzeichenkette, "
    "die früher

    ``am fruehsten''

    in der Zeichenkette beginnt. Falls der RA auf mehr als eine " "Teilzeichenkette passen könnte, die an diesem Punkt beginnt, stimmt er mit "
    "der längsten überein. Teilausdrücke passen auch auf die längsten möglichen "
    "Teilzeichenketten, mit der Nebenbedingung, dass die gesamte Übereinstimmung "
    "so lang wie möglich sein muss, wobei Teilausdrücke, die früher im RA " "beginnen gegenüber späteren Priorität haben. Beachten Sie, dass " "Teilausdrücke höherer Ordnung daher Priorität gegenüber ihren " "Komponententeilausdrücken niedrigerer Ordnung haben."

    #. type: Plain text
    #: archlinux debian-bullseye debian-unstable fedora-38 fedora-rawhide
    #: mageia-cauldron opensuse-leap-15-5 opensuse-tumbleweed
    msgid ""
    "Match lengths are measured in characters, not collating elements. A null " "string is considered longer than no match at all. For example, \"I<bb*>\" " "matches the three middle characters of \"abbbc\", \"I<(wee|week)(knights|" "nights)>\" matches all ten characters of \"weeknights\", when \"I<(.*).*>\" "
    "is matched against \"abc\" the parenthesized subexpression matches all three "
    "characters, and when \"I<(a*)*>\" is matched against \"bc\" both the whole " "RE and the parenthesized subexpression match the null string."
    msgstr ""
    "Die Länge von Übereinstimmungen wird in Zeichen gemessen, nicht in " "Sortierordnungselementen. Eine Null-Zeichenkette

    Evtl besser: ``eine leere Zeichenkette''

    wird als länger als keine "
    "Übereinstimmung betrachtet. Beispielsweise stimmt »I<bb*>« mit den drei " "mittleren Zeichen von »abbbc« überein, »I<(wee|week)(knights|nights)> stimmt "
    "mit allen zehn Zeichen von »weeknights« überein. Wird »I<(.*).*>« mit »abc« "
    "verglichen,

    ``... auf ... angewendet''. Vergleich finde ich ein unpassendes
    Wort, weil keine Gleichheit geprueft wird.

    passt der geklammerte Unterausdruck auf alle drei Zeichen und "

    Hier wuerde ich vor dem ``und'' ein Komma oder einen Strichpunkt
    setzen, um den folgenden Satzteil staerker abzugrenzen. An sich
    sind das ja zwei separate Saetze, die nichts miteinander zu tun
    haben. Die vorigen zwei Saetze stehen ja auch einzeln.

    "wenn »I<(a*)*>« mit »bc« verglichen wird, passen der gesamte RA und der "
    "geklammerte Unterausdruck auf die Null-Zeichenkette. "

    # FIXME alphabetic?
    # FIXME multiple cases → both cases?
    #. type: Plain text
    #: archlinux debian-unstable fedora-38 fedora-rawhide mageia-cauldron
    msgid ""
    "If case-independent matching is specified, the effect is much as if all case "
    "distinctions had vanished from the alphabet. When an alphabetic that exists "
    "in multiple cases appears as an ordinary character outside a bracket " "expression, it is effectively transformed into a bracket expression " "containing both cases, for example, \\[aq]x\\[aq] becomes \"I<[xX]>\". When "
    "it appears inside a bracket expression, all case counterparts of it are " "added to the bracket expression, so that, for example, \"I<[x]>\" becomes " "\"I<[xX]>\" and \"I<[\\[ha]x]>\" becomes \"I<[\\[ha]xX]>\"."
    msgstr ""
    "Falls der Vergleich unabhängig von der Groß-/Kleinschreibung verlangt wird, "
    "ist die Auswirkung so, als ob alle Unterscheidungen zwischen Groß- und " "Kleinschreibung im Alphabet verschwunden wären. Wenn ein alphabetisches " "Zeichen, das in verschiedenen Groß-/Kleinschreibungen existiert, als " "normales Zeichen außerhalb eines Klammerausdrucks auftaucht, wird es " "effektiv in einen Klammerausdruck, der Groß- und Kleinschreibung enthält, "
    "umgewandelt. Beispielsweise wird »x« »I<[xX]>«.

    ``... wird ... zu ...'' (also ``zu'' einfuegen, dann wird's
    leichter lesbar)

    Wenn es innerhalb eines "
    "Klammerausdrucks auftaucht, werden alle Entsprechungen in der Groß-/" "Kleinschreibung zu dem Klammerausdruck hinzugefügt, so dass beispielsweise "
    "aus »I<[x]>« »I<[xX]>« und aus »I<[\\[ha]x]>« »I<[\\[ha]xX]>« wird."

    #. type: Plain text
    #: archlinux debian-bullseye debian-unstable fedora-38 fedora-rawhide
    #: mageia-cauldron opensuse-leap-15-5 opensuse-tumbleweed
    msgid ""
    "No particular limit is imposed on the length of REs\\*(dg. Programs " "intended to be portable should not employ REs longer than 256 bytes, as an " "implementation can refuse to accept such REs and remain POSIX-compliant." msgstr ""
    "Die Länge des RAs unterliegt keiner besonderen Beschränkung\\(dg. Programme, "
    "die portierbar sein sollen, sollten die RA kürzer als 256 byte

    ``Bytes''? Falls ohne `s' dann zumindest gross, denke ich.

    halten, da "
    "eine POSIX-konforme Implementierung verweigern könnte, längere zu "

    ``laengere RA'' (macht es etwas fluessiger)

    "akzeptieren."

    #. type: Plain text
    #: archlinux debian-unstable fedora-38 fedora-rawhide mageia-cauldron
    msgid ""
    "Obsolete (\"basic\") regular expressions differ in several respects. \\[aq]|"
    "\\[aq], \\[aq]+\\[aq], and \\[aq]?\\[aq] are ordinary characters and there " "is no equivalent for their functionality. The delimiters for bounds are " "\"I<\\e{>\" and \"I<\\e}>\", with \\[aq]{\\[aq] and \\[aq]}\\[aq] by " "themselves ordinary characters. The parentheses for nested subexpressions " "are \"I<\\e(>\" and \"I<\\e)>\", with \\[aq](\\[aq] and \\[aq])\\[aq] by " "themselves ordinary characters. \\[aq]\\[ha]\\[aq] is an ordinary character "
    "except at the beginning of the RE or\\*(dg the beginning of a parenthesized "
    "subexpression, \\[aq]$\\[aq] is an ordinary character except at the end of " "the RE or\\*(dg the end of a parenthesized subexpression, and \\[aq]*\\[aq] "
    "is an ordinary character if it appears at the beginning of the RE or the " "beginning of a parenthesized subexpression (after a possible leading " "\\[aq]\\[ha]\\[aq])."
    msgstr ""
    "Veraltete (»einfache«) reguläre Ausdrücke unterscheiden sich in " "verschiedenen Hinsichten. »|«, »+« und »?« sind gewöhnliche Zeichen und es "
    "gibt kein Äquivalent für ihre Funktionalität. Die Begrenzer für " "Beschränkungen sind »I<\\e{>« und »I<\\e}>«, wobei »{« und »}« selbst "
    "gewöhnliche Zeichen sind. Die Klammern zum Verschachteln von Unterausdrücken "
    "sind »I<\\e(>« und »I<\\e)>«, wobei »(« und »)« selbst gewöhnliche Zeichen "

    Die beiden ``wobei'' gefallen mir nicht so gut, weil sich die
    nachfolgenden Klammern nicht auf die vorher erwaehnten escapten
    Klammern beziehen. Ich wuerde vielleicht mit einem Strichpunkt
    anfuegen: ``...; »{« und »}« alleinestehen sind gewoehnliche Zeichen''. (Das Wort ``alleinestehend'' scheint mir die Sache klarer zu
    machen.)

    "sind. »\\[ha]« ist ein gewöhnliches Zeichen außer am Anfang eines RA " "oder\\(dg am Anfang eines geklammerten Unterausdrucks. »?« ist ein "

    Es muss hier `$' statt `?' sein!

    "gewöhnliches Zeichen außer am Ende eines RA oder\\(dg am Ende eines " "geklammerten Unterausdrucks. »*« ist ein gewöhnliches Zeichen, falls es am "
    "Anfang des RA oder am Anfang des geklammerten Unterausdrucks (nach dem " "möglichen einleitenden »\\[ha]«) auftaucht."

    #. type: Plain text
    #: archlinux debian-bullseye debian-unstable fedora-38 fedora-rawhide
    #: mageia-cauldron opensuse-leap-15-5 opensuse-tumbleweed
    msgid "Having two kinds of REs is a botch."
    msgstr "Die Existenz von zwei Arten von RAs ist Murks."

    Das Wort ``Murks'' gefaellt mir. ;-)


    #. type: Plain text
    #: archlinux debian-bullseye debian-unstable fedora-38 fedora-rawhide
    #: mageia-cauldron opensuse-leap-15-5 opensuse-tumbleweed
    msgid ""
    "Back references are a dreadful botch, posing major problems for efficient " "implementations. They are also somewhat vaguely defined (does " "\"I<a\\e(\\e(b\\e)*\\e2\\e)*d>\" match \"abbbd\"?). Avoid using them." msgstr ""
    "Rückwärtsreferenzen sind ein schecklicher

    ``schrecklicher'' (mit `r')

    Murks. Sie stellen ein großes "
    "Problem für effiziente Implementierungen dar. Sie sind auch etwas vage " "definiert (stimmt »I<a\\e(\\e(b\\e)*\\e2\\e)*d>« mit »abbbd« überein?). "
    "Verlassen Sie sich nicht darauf."

    #. Sigh... The page license means we must have the author's name
    #. in the formatted output.
    #. type: Plain text
    #: archlinux debian-bullseye debian-unstable fedora-38 fedora-rawhide
    #: mageia-cauldron opensuse-leap-15-5 opensuse-tumbleweed
    msgid "This page was taken from Henry Spencer's regex package."
    msgstr "Diese Seite wurde von Henry Spencers Paket Regex genommen."

    ``uebernommen''? So wie der Satz jetzt da steht, hoert er sich
    nicht so richtig deutsch an, finde ich.


    meillo

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)
  • From markus schnalke@21:1/5 to All on Fri May 5 16:30:01 2023
    Hoi.

    [2023-05-05 16:11] Helge Kreutzmann <debian@helgefjell.de>
    On Fri, May 05, 2023 at 09:22:24AM +0200, markus schnalke wrote:
    Hier meine Anmerkungen zu Teil 2.

    Danke für das QS-Lesen! Siehe auch meine Inline-Rückfrage.

    [2023-05-04 21:54] Helge Kreutzmann <debian@helgefjell.de>

    wird als länger als keine "
    "Übereinstimmung betrachtet. Beispielsweise stimmt »I<bb*>« mit den drei "
    "mittleren Zeichen von »abbbc« überein, »I<(wee|week)(knights|nights)> stimmt "
    "mit allen zehn Zeichen von »weeknights« überein. Wird »I<(.*).*>« mit »abc« "
    "verglichen,

    ``... auf ... angewendet''. Vergleich finde ich ein unpassendes
    Wort, weil keine Gleichheit geprueft wird.

    Mir ist leider nicht klar, was Du hiergeändert haben möchtest. Das
    Wort „angewendet“ habe ich gar nicht verwandt?

    Ja, da war mein Kommentar etwas zu kryptisch. ;-)

    Du hast geschrieben, dass eine RE mit einem String verglichen wird.
    Das finde ich inhaltlich unpassend, weil man REs und Strings IMO
    nicht vergleichen kann, sondern eine RE *matcht* auf einen String.
    Folglich sollte der Satz lauten: ``Wird »I<(.*).*>« auf »abc«
    angewendet, ...'' (oder etwas in der Art).


    Die Stellen, an denen du meine Vorschlaege nicht uebernommen hast,
    kann ich nachvollziehen. So ist mir das recht: ich schlage vor und
    du uebernimmst es oder eben nicht. ;-)


    meillo


    P.S.
    Momentan bin ich auf der Liste angemeldet, werde mich aber wohl
    wieder abmelden oder die Liste zumindest nicht mehr aktiv
    verfolgen. Wenn du mal wieder eine aehnliche Seite uebersetzt, die
    etwas mehr technischen Tiefgang hat, dann kannst du mich gerne fuer
    die Korrekturlesung in den CC nehmen. Oder Christoph weist mich
    wieder darauf hin.

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)
  • From Helge Kreutzmann@21:1/5 to markus schnalke on Fri May 5 17:00:01 2023
    This is a MIME-formatted message. If you see this text it means that your E-mail software does not support MIME-formatted messages.

    Hallo Markus,
    wow, Du bist ja ultraschnell :-))

    On Fri, May 05, 2023 at 04:28:18PM +0200, markus schnalke wrote:
    [2023-05-05 16:11] Helge Kreutzmann <debian@helgefjell.de>
    On Fri, May 05, 2023 at 09:22:24AM +0200, markus schnalke wrote:
    wird als länger als keine "
    "Übereinstimmung betrachtet. Beispielsweise stimmt »I<bb*>« mit den drei "
    "mittleren Zeichen von »abbbc« überein, »I<(wee|week)(knights|nights)> stimmt "
    "mit allen zehn Zeichen von »weeknights« überein. Wird »I<(.*).*>« mit »abc« "
    "verglichen,

    ``... auf ... angewendet''. Vergleich finde ich ein unpassendes
    Wort, weil keine Gleichheit geprueft wird.

    Mir ist leider nicht klar, was Du hiergeändert haben möchtest. Das
    Wort „angewendet“ habe ich gar nicht verwandt?

    Ja, da war mein Kommentar etwas zu kryptisch. ;-)

    Du hast geschrieben, dass eine RE mit einem String verglichen wird.
    Das finde ich inhaltlich unpassend, weil man REs und Strings IMO
    nicht vergleichen kann, sondern eine RE *matcht* auf einen String.

    Ich finde vergleichen schon passend, und „match“ ist eine Übersetzung
    für vergleichen. Nur kein binärer Vergleich (ja/nein), sondern einer,
    der eine Zeichnenkette zurückliefert.

    Folglich sollte der Satz lauten: ``Wird »I<(.*).*>« auf »abc«
    angewendet, ...'' (oder etwas in der Art).

    D.h. Du fasst die regulären Ausdrücke als eine Art Funktion auf? Das
    wäre dann freier übersetzt.

    Muss ich kurz drüber nachdenken.

    Die Stellen, an denen du meine Vorschlaege nicht uebernommen hast,
    kann ich nachvollziehen. So ist mir das recht: ich schlage vor und
    du uebernimmst es oder eben nicht. ;-)

    So arbeiten wir; und ganz herzlichen Dank für Deine wertvollen
    Vorschläge.

    meillo


    P.S.
    Momentan bin ich auf der Liste angemeldet, werde mich aber wohl
    wieder abmelden oder die Liste zumindest nicht mehr aktiv
    verfolgen. Wenn du mal wieder eine aehnliche Seite uebersetzt, die
    etwas mehr technischen Tiefgang hat, dann kannst du mich gerne fuer
    die Korrekturlesung in den CC nehmen. Oder Christoph weist mich
    wieder darauf hin.

    Machen wir so.

    Danke nochmals.

    Viele Grüße

    Helge
    --
    Dr. Helge Kreutzmann debian@helgefjell.de
    Dipl.-Phys. http://www.helgefjell.de/debian.php
    64bit GNU powered gpg signed mail preferred
    Help keep free software "libre": http://www.ffii.de/

    -----BEGIN PGP SIGNATURE-----

    iQIzBAABCAAdFiEEbZZfteMW0gNUynuwQbqlJmgq5nAFAmRVGWQACgkQQbqlJmgq 5nAInQ//SKuNmieoYPWOapplja95CVXArHBfUKW34KJ3xLwOUvNrDS1E+K/pei0S 4U80VG4Mlw7hi5KoQzszqrhgrcQVQ5E3zO9tPot8nsTDCfCypwY3sKQ+depuJuNs 1/vHE1MWuJx6omTP6vAJVKMs1qk6vGEXAbqWylYzvc1JmVJnGuhYY93Sw8qq/pru aFygOaCEQxdasV4kuAeilSutWZDPu2HB1tDl4CCDsypCi26U6TECeWo1J8y9EOgD YshyQUqLOScMKHNdsjigaOYRl1caDT7R3x3xfvmRVrc5g93Ota4u+bwEPKQZ8Gs5 Wk1OQafn5tHCkLV4xKeckWOmPf8j5/sujDjtU+B9Uj0ycmgkOjahG2zaGKP9bb2Z gBrS65HMx+BSBgpB7fSM63gnDWntP4HEkQ2R/X6Yf8eKcHx6it1ToBqUbA5iyyuV ZuF+k81JjW+YftNnmoGpr0dwNBnaEEKkR+OMFNIjauSF306IIMO3DCU+CIbn5Kqx 3+AOdjL33FOqStfqdgvuhvoY8SjQrmc4t2tTdllquePWL6HvfiuIhkAUXVVji5i/ WyUbPYb75NOGkXmwVMAA0m6VLb8CUauYhOwgE5h
  • From Helge Kreutzmann@21:1/5 to markus schnalke on Fri May 5 16:20:01 2023
    This is a MIME-formatted message. If you see this text it means that your E-mail software does not support MIME-formatted messages.

    Hallo Markus,
    On Fri, May 05, 2023 at 09:22:24AM +0200, markus schnalke wrote:
    Hier meine Anmerkungen zu Teil 2.

    Danke für das QS-Lesen! Siehe auch meine Inline-Rückfrage.

    [2023-05-04 21:54] Helge Kreutzmann <debian@helgefjell.de>

    #. type: Plain text
    #: archlinux debian-bullseye debian-unstable fedora-38 fedora-rawhide
    #: mageia-cauldron opensuse-leap-15-5 opensuse-tumbleweed
    msgid ""
    "These stand for the character classes defined in B<wctype>(3). A locale may "
    "provide others. A character class may not be used as an endpoint of a range."
    msgstr ""
    "Diese stehen für die in B<wctype>(3) definierten Zeichenklassen. Eine Locale "

    Ist ``die Locale'' ueblich? Ich haette ``das Locale'' gesagt. Es
    sollte halt zu den anderen Manpages passen.

    Bei eingedeutschten Wörtern ist das ja etwas trickig, für mich ist
    „die“ korrekt.

    "könnte andere bereitstellen. Eine Zeichenklasse darf nicht als Endpunkte "

    ``Endpunkt'' (Einzahl)

    Korrigiert.

    "eines Bereichs verwandt werden."

    #. type: Plain text
    #: archlinux debian-bullseye debian-unstable fedora-38 fedora-rawhide
    #: mageia-cauldron opensuse-leap-15-5 opensuse-tumbleweed
    msgid ""
    "In the event that an RE could match more than one substring of a given " "string, the RE matches the one starting earliest in the string. If the RE "
    "could match more than one substring starting at that point, it matches the "
    "longest. Subexpressions also match the longest possible substrings, subject "
    "to the constraint that the whole match be as long as possible, with " "subexpressions starting earlier in the RE taking priority over ones starting "
    "later. Note that higher-level subexpressions thus take priority over their "
    "lower-level component subexpressions."
    msgstr ""
    "Falls ein RA mit mehr als einer Teilzeichenkette einer gegebenen " "Zeichenkette übereinstimmen könnte, passt der RA auf die Teilzeichenkette, "
    "die früher

    ``am fruehsten''

    Korrigiert.

    in der Zeichenkette beginnt. Falls der RA auf mehr als eine " "Teilzeichenkette passen könnte, die an diesem Punkt beginnt, stimmt er mit "
    "der längsten überein. Teilausdrücke passen auch auf die längsten möglichen "
    "Teilzeichenketten, mit der Nebenbedingung, dass die gesamte Übereinstimmung "
    "so lang wie möglich sein muss, wobei Teilausdrücke, die früher im RA " "beginnen gegenüber späteren Priorität haben. Beachten Sie, dass " "Teilausdrücke höherer Ordnung daher Priorität gegenüber ihren " "Komponententeilausdrücken niedrigerer Ordnung haben."

    #. type: Plain text
    #: archlinux debian-bullseye debian-unstable fedora-38 fedora-rawhide
    #: mageia-cauldron opensuse-leap-15-5 opensuse-tumbleweed
    msgid ""
    "Match lengths are measured in characters, not collating elements. A null "
    "string is considered longer than no match at all. For example, \"I<bb*>\" "
    "matches the three middle characters of \"abbbc\", \"I<(wee|week)(knights|" "nights)>\" matches all ten characters of \"weeknights\", when \"I<(.*).*>\" "
    "is matched against \"abc\" the parenthesized subexpression matches all three "
    "characters, and when \"I<(a*)*>\" is matched against \"bc\" both the whole "
    "RE and the parenthesized subexpression match the null string."
    msgstr ""
    "Die Länge von Übereinstimmungen wird in Zeichen gemessen, nicht in " "Sortierordnungselementen. Eine Null-Zeichenkette

    Evtl besser: ``eine leere Zeichenkette''

    Finde ich auch besser, übernommen.


    wird als länger als keine "
    "Übereinstimmung betrachtet. Beispielsweise stimmt »I<bb*>« mit den drei "
    "mittleren Zeichen von »abbbc« überein, »I<(wee|week)(knights|nights)> stimmt "
    "mit allen zehn Zeichen von »weeknights« überein. Wird »I<(.*).*>« mit »abc« "
    "verglichen,

    ``... auf ... angewendet''. Vergleich finde ich ein unpassendes
    Wort, weil keine Gleichheit geprueft wird.

    Mir ist leider nicht klar, was Du hiergeändert haben möchtest. Das
    Wort „angewendet“ habe ich gar nicht verwandt?

    passt der geklammerte Unterausdruck auf alle drei Zeichen und "

    Hier wuerde ich vor dem ``und'' ein Komma oder einen Strichpunkt
    setzen, um den folgenden Satzteil staerker abzugrenzen. An sich
    sind das ja zwei separate Saetze, die nichts miteinander zu tun
    haben. Die vorigen zwei Saetze stehen ja auch einzeln.

    Geändert. Ich hatte auch kurz drüber nachgedacht, mit Satzpunkt zu
    arbeiten.

    "wenn »I<(a*)*>« mit »bc« verglichen wird, passen der gesamte RA und der "
    "geklammerte Unterausdruck auf die Null-Zeichenkette. "

    # FIXME alphabetic?
    # FIXME multiple cases → both cases?
    #. type: Plain text
    #: archlinux debian-unstable fedora-38 fedora-rawhide mageia-cauldron
    msgid ""
    "If case-independent matching is specified, the effect is much as if all case "
    "distinctions had vanished from the alphabet. When an alphabetic that exists "
    "in multiple cases appears as an ordinary character outside a bracket " "expression, it is effectively transformed into a bracket expression " "containing both cases, for example, \\[aq]x\\[aq] becomes \"I<[xX]>\". When "
    "it appears inside a bracket expression, all case counterparts of it are " "added to the bracket expression, so that, for example, \"I<[x]>\" becomes "
    "\"I<[xX]>\" and \"I<[\\[ha]x]>\" becomes \"I<[\\[ha]xX]>\"."
    msgstr ""
    "Falls der Vergleich unabhängig von der Groß-/Kleinschreibung verlangt wird, "
    "ist die Auswirkung so, als ob alle Unterscheidungen zwischen Groß- und " "Kleinschreibung im Alphabet verschwunden wären. Wenn ein alphabetisches " "Zeichen, das in verschiedenen Groß-/Kleinschreibungen existiert, als " "normales Zeichen außerhalb eines Klammerausdrucks auftaucht, wird es " "effektiv in einen Klammerausdruck, der Groß- und Kleinschreibung enthält, "
    "umgewandelt. Beispielsweise wird »x« »I<[xX]>«.

    ``... wird ... zu ...'' (also ``zu'' einfuegen, dann wird's
    leichter lesbar)

    Stimmt, eingefügt.

    Wenn es innerhalb eines "
    "Klammerausdrucks auftaucht, werden alle Entsprechungen in der Groß-/" "Kleinschreibung zu dem Klammerausdruck hinzugefügt, so dass beispielsweise "
    "aus »I<[x]>« »I<[xX]>« und aus »I<[\\[ha]x]>« »I<[\\[ha]xX]>« wird."

    #. type: Plain text
    #: archlinux debian-bullseye debian-unstable fedora-38 fedora-rawhide
    #: mageia-cauldron opensuse-leap-15-5 opensuse-tumbleweed
    msgid ""
    "No particular limit is imposed on the length of REs\\*(dg. Programs " "intended to be portable should not employ REs longer than 256 bytes, as an "
    "implementation can refuse to accept such REs and remain POSIX-compliant." msgstr ""
    "Die Länge des RAs unterliegt keiner besonderen Beschränkung\\(dg. Programme, "
    "die portierbar sein sollen, sollten die RA kürzer als 256 byte

    ``Bytes''? Falls ohne `s' dann zumindest gross, denke ich.

    Der Plural ist ohne „s“. Bezüglich Groß-/Kleinschreibung habe ich noch ein TODO; wenn das geklärt ist, ziehe ich es in allen Handbuchseiten
    nach.

    halten, da "
    "eine POSIX-konforme Implementierung verweigern könnte, längere zu "

    ``laengere RA'' (macht es etwas fluessiger)

    Eingefügt.

    "akzeptieren."

    #. type: Plain text
    #: archlinux debian-unstable fedora-38 fedora-rawhide mageia-cauldron
    msgid ""
    "Obsolete (\"basic\") regular expressions differ in several respects. \\[aq]|"
    "\\[aq], \\[aq]+\\[aq], and \\[aq]?\\[aq] are ordinary characters and there "
    "is no equivalent for their functionality. The delimiters for bounds are " "\"I<\\e{>\" and \"I<\\e}>\", with \\[aq]{\\[aq] and \\[aq]}\\[aq] by " "themselves ordinary characters. The parentheses for nested subexpressions "
    "are \"I<\\e(>\" and \"I<\\e)>\", with \\[aq](\\[aq] and \\[aq])\\[aq] by " "themselves ordinary characters. \\[aq]\\[ha]\\[aq] is an ordinary character "
    "except at the beginning of the RE or\\*(dg the beginning of a parenthesized "
    "subexpression, \\[aq]$\\[aq] is an ordinary character except at the end of "
    "the RE or\\*(dg the end of a parenthesized subexpression, and \\[aq]*\\[aq] "
    "is an ordinary character if it appears at the beginning of the RE or the " "beginning of a parenthesized subexpression (after a possible leading " "\\[aq]\\[ha]\\[aq])."
    msgstr ""
    "Veraltete (»einfache«) reguläre Ausdrücke unterscheiden sich in " "verschiedenen Hinsichten. »|«, »+« und »?« sind gewöhnliche Zeichen und es "
    "gibt kein Äquivalent für ihre Funktionalität. Die Begrenzer für " "Beschränkungen sind »I<\\e{>« und »I<\\e}>«, wobei »{« und »}« selbst "
    "gewöhnliche Zeichen sind. Die Klammern zum Verschachteln von Unterausdrücken "
    "sind »I<\\e(>« und »I<\\e)>«, wobei »(« und »)« selbst gewöhnliche Zeichen "

    Die beiden ``wobei'' gefallen mir nicht so gut, weil sich die
    nachfolgenden Klammern nicht auf die vorher erwaehnten escapten
    Klammern beziehen. Ich wuerde vielleicht mit einem Strichpunkt
    anfuegen: ``...; »{« und »}« alleinestehen sind gewoehnliche Zeichen''. (Das Wort ``alleinestehend'' scheint mir die Sache klarer zu
    machen.)

    Ich sehe da shcon den Zusammenhang, aber Deine Formulierung geht
    natürlich auch; dann nehme ich sie.

    "sind. »\\[ha]« ist ein gewöhnliches Zeichen außer am Anfang eines RA " "oder\\(dg am Anfang eines geklammerten Unterausdrucks. »?« ist ein "

    Es muss hier `$' statt `?' sein!

    Korrigiert.

    "gewöhnliches Zeichen außer am Ende eines RA oder\\(dg am Ende eines " "geklammerten Unterausdrucks. »*« ist ein gewöhnliches Zeichen, falls es am "
    "Anfang des RA oder am Anfang des geklammerten Unterausdrucks (nach dem " "möglichen einleitenden »\\[ha]«) auftaucht."

    #. type: Plain text
    #: archlinux debian-bullseye debian-unstable fedora-38 fedora-rawhide
    #: mageia-cauldron opensuse-leap-15-5 opensuse-tumbleweed
    msgid "Having two kinds of REs is a botch."
    msgstr "Die Existenz von zwei Arten von RAs ist Murks."

    Das Wort ``Murks'' gefaellt mir. ;-)


    #. type: Plain text
    #: archlinux debian-bullseye debian-unstable fedora-38 fedora-rawhide
    #: mageia-cauldron opensuse-leap-15-5 opensuse-tumbleweed
    msgid ""
    "Back references are a dreadful botch, posing major problems for efficient "
    "implementations. They are also somewhat vaguely defined (does " "\"I<a\\e(\\e(b\\e)*\\e2\\e)*d>\" match \"abbbd\"?). Avoid using them." msgstr ""
    "Rückwärtsreferenzen sind ein schecklicher

    ``schrecklicher'' (mit `r')

    Korrigiert.

    Murks. Sie stellen ein großes "
    "Problem für effiziente Implementierungen dar. Sie sind auch etwas vage " "definiert (stimmt »I<a\\e(\\e(b\\e)*\\e2\\e)*d>« mit »abbbd« überein?). "
    "Verlassen Sie sich nicht darauf."

    #. Sigh... The page license means we must have the author's name
    #. in the formatted output.
    #. type: Plain text
    #: archlinux debian-bullseye debian-unstable fedora-38 fedora-rawhide
    #: mageia-cauldron opensuse-leap-15-5 opensuse-tumbleweed
    msgid "This page was taken from Henry Spencer's regex package."
    msgstr "Diese Seite wurde von Henry Spencers Paket Regex genommen."

    ``uebernommen''? So wie der Satz jetzt da steht, hoert er sich
    nicht so richtig deutsch an, finde ich.

    Ich habe jetzt:
    Diese Seite entstammt Henry Spencers Paket Regex.

    geschrieben.

    Viele Grüße

    Helge
    --
    Dr. Helge Kreutzmann debian@helgefjell.de
    Dipl.-Phys. http://www.helgefjell.de/debian.php
    64bit GNU powered gpg signed mail preferred
    Help keep free software "libre": http://www.ffii.de/

    -----BEGIN PGP SIGNATURE-----

    iQIzBAABCAAdFiEEbZZfteMW0gNUynuwQbqlJmgq5nAFAmRVDnwACgkQQbqlJmgq 5nA9Mw//R2xg7xa/5/4oqlpUde+T9Pkm/FMXL0aVVLhi0BQICQNExFEaQO16MTBt +pPIeFZehCTUcXV9AdKSqL8nQSwPYqjzJmQaRf8khRT5WnR+Zw3bLNjkTLwFmQly lth3Mi9GakhIb2sN4ZLyhoVu5XwRzly0NSjg1T2/l1knQ+sH1zdtUMZofDHscmVQ MhMLtstYtcGhc/2XsJE+w3hfFjuKpLk/j0H9a7kUhJ2bdqecW55IX+32khnj4bT3 Pf8Ppws9J2uZqXoipuVS0YCEfbjfranUBXLmt4GUjiB1BBAwtK5WRWgPMCV7XV/C /cChNbbBapZUzHQkCrIVW9glQjZtwOTJOmAkiDR6PlAEGHQWl18FoLRAdH41Kttm iS1aSY9D7I31zt3j6Y9jaAZ+ubSeEMzhH/1e0Xdl750TLmHVIMUr4qDyG+YVS/m8 BuzPybxc4LXhgpGgv9shymYa2m0bzmtsYUd5OKBE8iaGDnfM/KQm+iKAxegs6G4Z 98O9Qaz0nUkgcykHAx4MIXeAZeWWekM++Xx+nR3xUqhN46wR4VxLVpZdhaGb8hPc P3sdD7LU+puFcaJJZpHilKMkZVQOzRrijULzfHF
  • From markus schnalke@21:1/5 to All on Fri May 5 17:50:01 2023
    Hoi.

    [2023-05-05 16:57] Helge Kreutzmann <debian@helgefjell.de>
    On Fri, May 05, 2023 at 04:28:18PM +0200, markus schnalke wrote:
    [2023-05-05 16:11] Helge Kreutzmann <debian@helgefjell.de>
    On Fri, May 05, 2023 at 09:22:24AM +0200, markus schnalke wrote:
    wird als länger als keine "
    "Übereinstimmung betrachtet. Beispielsweise stimmt »I<bb*>« mit den drei "
    "mittleren Zeichen von »abbbc« überein, »I<(wee|week)(knights|nights)> stimmt "
    "mit allen zehn Zeichen von »weeknights« überein. Wird »I<(.*).*>« mit »abc« "
    "verglichen,

    ``... auf ... angewendet''. Vergleich finde ich ein unpassendes
    Wort, weil keine Gleichheit geprueft wird.

    Mir ist leider nicht klar, was Du hiergeändert haben möchtest. Das
    Wort „angewendet“ habe ich gar nicht verwandt?

    Ja, da war mein Kommentar etwas zu kryptisch. ;-)

    Du hast geschrieben, dass eine RE mit einem String verglichen wird.
    Das finde ich inhaltlich unpassend, weil man REs und Strings IMO
    nicht vergleichen kann, sondern eine RE *matcht* auf einen String.

    Ich finde vergleichen schon passend, und „match“ ist eine Übersetzung für vergleichen. Nur kein binärer Vergleich (ja/nein), sondern einer,
    der eine Zeichnenkette zurückliefert.

    Folglich sollte der Satz lauten: ``Wird »I<(.*).*>« auf »abc« angewendet, ...'' (oder etwas in der Art).

    D.h. Du fasst die regulären Ausdrücke als eine Art Funktion auf? Das
    wäre dann freier übersetzt.

    Muss ich kurz drüber nachdenken.

    Ich will meine Gedanken dazu nochmal genauer erklaeren:

    Vergleichen fusst auf Gleichheit. Gleich koennen nur gleichartige
    Dinge sein.

    REs und Strings sind sehr verschiedenartige Dinge. Strings sind
    reine Zeichenfolgen. REs dagegen sind Beschreibungen von Mengen von Zeichenketten. Ich bin kein Sprachwissenschaftler, darum bin ich
    hier vielleicht ungenau: eine konkrete RE definiert alle Woerter
    einer Sprache. Die jeweiligen Strings, die darauf matchen, sind
    somit Teil dieser Sprache.

    Um es mal in ein anderes Feld zu uebertragen: Der obige Satz
    dann lauten: ``Wird die Deutsche Sprache mit dem Wort `Haus'
    verglichen, ...'' Das macht wenig Sinn. Der Sprachtheoretiker
    wuerde sagen: ``Ist `Haus' Teil der Deutschen Sprache, ...'' In
    unserem Fall waere es dann: ``Ist »abc« Teil der durch die RE
    »I<(.*).*>« definierten Sprache, ...'' Allerdings haben
    Programmierer einen anderen Betrachtungswinkel. Sie reden davon,
    ob die RE auf einen String matcht, also ob sie ``passt''.

    In gewisser Weise ist eine RE eine Pruefroutine, die die Frage
    beantwortet, ob der String zu der durch die RE definierten Sprache
    (= Menge an Woertern) gehoert. So komme ich auf das Wort
    ``anwenden''. Konkret passiert hier aber, wie du schon andeutest,
    mehr: die Antwort ist nicht nur ja/nein, sondern die Antwort ist
    der frueheste, laengste Substring, auf den die RE passt oder die
    Information, dass sie gar nicht passt. Das wuerde ich als
    Routine/Funktion ansehen, die man anwendet.

    Letztlich muessen wir einsehen, dass es im Deutschen keine direkte
    Entsprechung von ``to match a RE to a string'' gibt. Will man die
    Satzstruktur moeglichst gleich lassen, so denke ich, ist ``einen RA
    auf einen String anwenden'' die beste Umschreibung.

    Alternativ koennte man versuchen den Satz so umformulieren, dass man
    das Wort ``passen'' verwenden kann. Hierbei muss man aber
    aufpassen, denn uebersetzt man:

    and when "(a*)*" is matched against "bc" both the whole RE
    and the parenthesized subexpression match the null string.

    mit:

    und "(a*)*" passt auf den leeren String von "bc", sowohl
    der ganze RA als auch der geklammerte Unterausdruck.

    dann ist das nicht vollstaendig, denn "a*" passt auch auf "a" von
    "aaaab", aber wendet man es an, dann wird das Ergebnis "aaaa" sein.
    Die RE passt auf viele Substrings, entscheidend ist aber, welcher
    das Ergebnis der POSIX-konformen Match-Funktion ist.


    Puh, jetzt habe ich viel geschrieben. Das ist nun auch wirklich
    nicht einfach. Ich finde, bei REs muss man sein Gehirn erstmal
    richtig hindrehen, damit das Denken dazu kompatibel ist. Wenn man
    nicht ganz passend dazu denkt, dann funktioniert es zwar fuer die
    einfachen Faelle, aber fuer die komplizierteren nicht mehr. Darum
    lege ich hier so viel Wert darauf, die Dinge inhaltlich moeglichst
    korrekt zu formulieren (zumindest nach dem was ich fuer korrekt
    halte ;-) ).


    Nachdem ich nun noch ein bisschen in dem Buch von Friedl gestoebert
    habe, bin ich auf die Idee gekommen, dass man auch das Wort
    ``suchen'' verwenden koennte:

    und wenn in "abc" nach "(a*)*" gesucht wird, dann ist das
    Ergebnis, sowohl des ganzen RAs als auch des geklammerten
    Unterausdrucks, der leere String.

    Auch diese Formulierung waere noch eine Option:

    der RA "(a*)*" erkennt in "abc" den leeren String, sowohl
    fuer den ganzen RA als auch fuer den geklammerten
    Teilausdruck


    Mit diesem Blumenstrauss an Gedanken und Vorschlaegen lasse ich es
    hier erstmal bewenden, bevor ich mich noch tiefer darin verstricke.
    Du kannst dann auswuerfeln, wie du es letztlich machen willst. :-D


    markus

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)