Übliche Metazeichen

(Auszug aus "Reguläre Ausdrücke" von Jeffrey E. F. Friedl)

Im Rest dieses Kapitels geht es um die Metazeichen und Features, die von etlichen Programmen implementiert sind; die nächste Tabelle bietet dazu einen Überblick. Es werden nicht alle Aspekte beschrieben, und keines der behandelten Programme kennt alle aufgeführten Metazeichen. In einem gewissen Sinne ist dies eine Zusammenfassung dessen, was wir unter Einführung in reguläre Ausdrücke und Erweiterte einführende Beispiele angetroffen haben, aber in einem größeren Zusammenhang und mit der Grundlage, die wir am Anfang von Features und Dialekte erarbeitet haben. Ein Durchlesen reicht für das Verständnis der späteren Kapitel, Sie können immer zu den hier aufgeführten Details zurückblättern.

Bei manchen Programmierwerkzeugen werden alle erdenklichen Notationen implementiert, bei anderen wird ganz nach Lust und Laune die Bedeutung von bereits bekannten Metazeichen umdefiniert. Ich mache ab und zu Bemerkungen zu bestimmten Implementationen, aber ich gehe hier nicht zu stark auf einzelne Werkzeuge ein. Dieser Abschnitt soll nur die verbreiteten Metazeichen und deren Verwendung abdecken, und auch die Besonderheiten, die man dabei beachten muss. Für alles Weitergehende muss ich auf die Dokumentation des jeweiligen Werkzeugs verweisen.

Die folgende Tabelle ist eine Übersicht über die nächsten Abschnitte mit Querverweisen auf die Seiten, auf denen die jeweiligen Features und Metazeichen behandelt werden.

Tabelle: In diesem Abschnitt behandelte Konstrukte.

Zeichendarstellung
siehe Abkürzungsmetazeichen... Abkürzungsmetazeichen: \n, \t, \a, \b, \e, \f, \r, \v, ...
siehe Oktale Escapes... Oktale Escapes: \Zahl
siehe Hexadezimale Escapes... Hexadezimale Escapes und Unicode-Escapes: \xZahl, \x{Zahl}, \uZahl, \UZahl, ...
siehe Steuerzeichen... Steuerzeichen: \cZeichen
Zeichenklassen und ähnliche Konstrukte
siehe Normale Klassen... Normale Klassen: [a-z] und [^a-z]
siehe Fast jedes Zeichen... Fast jedes Zeichen: Punkt
siehe Genau ein Byte... Genau ein Byte: \C
siehe Unicode-Sequenz... Unicode-Sequenz für kombinierende Zeichen: \X
siehe Abkürzungen... Abkürzungen für Zeichenklassen: \w, \d, \s, \W, \D, \S
siehe Unicode-Eigenschaften... Unicode-Eigenschaften, Schriftsysteme (Scripts) und Blockbereiche: \p{Prop}, \P{Prop}
siehe Mengenoperationen... Mengenoperationen mit Zeichenklassen: [[a-z]&&[^aeiou]]
siehe POSIX-Klammerausdruck »Zeichen... POSIX-Klammerausdruck »Zeichenklasse«: [[:alpha:]]
siehe POSIX-Klammerausdruck »Kollations... POSIX-Klammerausdruck »Kollationssequenz«: [[.span-ll.]]
siehe POSIX-Klammerausdruck »Zeichen... POSIX-Klammerausdruck »Zeichenäquivalent«: [[=n=]]
siehe Syntaxklassen in Emacs Syntaxklassen in Emacs
Anker und andere »Zusicherungen der Länge null«
siehe Zeilenanfang, Stringanfang... Zeilenanfang, Stringanfang: ^, \A
siehe Zeilenende, Stringende... Zeilenende, Stringende: $, \Z, \z
siehe Beginn der neuen... Beginn der neuen (oder Ende der letzten) Mustersuche: \G
siehe Wortgrenzen... Wortgrenzen: \b, \B, \<, \>, ...
siehe Lookahead... Lookahead: (?=...), (?!...); Lookbehind: (?<=...), (?<!...)
Kommentare und Modus-Modifikatoren
siehe Modus-Modifikatoren... Modus-Modifikatoren: (?Modifikator), z.B. (?i) und (?-i)
siehe Modus-Modifikatoren mit Klammerung... Modus-Modifikatoren mit Klammerung: (?Modifikator:...), z.B. (?i:...)
siehe Kommentare... Kommentare: (?#...) und #...
siehe Literaler Text... Literaler Text: \Q...\E
Gruppierende und einfangende Klammern, logische und gierige Konstrukte
siehe Gruppierende und einfangende Klammern... Gruppierende und einfangende Klammern: (...), \1, \2, ...
siehe Nur gruppierende... Nur gruppierende (nicht-einfangende) Klammern: (?:...)
siehe Benannte Unterausdrücke... Benannte Unterausdrücke: (?<Name>...)
siehe Atomare Klammern... Atomare Klammern: (?>...)
siehe Alternation... Alternation: ...|...|...
siehe Bedingte reguläre Ausdrücke... Bedingte reguläre Ausdrücke: (? if then|else)
siehe Gierige Quantoren... Gierige Quantoren: *, +, ?, {min, max}
siehe Nicht-gierige... Nicht-gierige, »genügsame« Quantoren: *?, +?, ??, {min, max}?
siehe Possessive Quantoren... Possessive Quantoren: *+, ++, ?+, {min, max}+

  

  

<< zurück vor >>

 

 

 

Tipp der data2type-Redaktion:
Zum Thema Reguläre Ausdrücke bieten wir auch folgende Schulungen zur Vertiefung und professionellen Fortbildung an:
   

Copyright der deutschen Ausgabe © 2008 by O’Reilly Verlag GmbH & Co. KG
Für Ihren privaten Gebrauch dürfen Sie die Online-Version ausdrucken.
Ansonsten unterliegt dieses Kapitel aus dem Buch "Reguläre Ausdrücke" denselben Bestimmungen, wie die gebundene Ausgabe: Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Alle Rechte vorbehalten einschließlich der Vervielfältigung, Übersetzung, Mikroverfilmung sowie Einspeicherung und Verarbeitung in elektronischen Systemen.

O’Reilly Verlag GmbH & Co. KG, Balthasarstr. 81, 50670 Köln