Literalen Text herausstellen

(Auszug aus "Reguläre Ausdrücke" von Jeffrey E. F. Friedl)

Viele der internen Optimierungen hängen davon ab, ob die Regex-Maschine feststellen kann, dass in einem Treffer ein Stück literaler Text vorkommen muss. Manche Maschinen sind da geschickter als andere. Wenn man literalen Text auch für die Regex-Maschine besser erkennbar macht, wird die Möglichkeit zur Optimierung eher erkannt.

Mindestanzahl bei Quantoren ausklammern

Wenn ˹xx*˼ statt ˹x+˼ geschrieben wird, wird klar, dass zumindest ein ›x‹ in jedem Treffer vorkommen muss. Die gleiche Art von Überlegung führt von ˹-{5,7}˼ zu ˹------{0,2}˼.

Gemeinsame Teile der Alternation ausklammern

Wenn statt ˹(?:klipp|klar)˼ die ausgeklammerte Form ˹kl(?:ipp|ar)˼ benutzt wird, kann die Maschine eher erkennen, dass in jedem Fall ein ›kl‹ im Treffer vorkommen muss. Man kann auch auf der rechten Seite ausklammern, z.B. bei ˹(?:Optim|Standardis)ierung˼. Noch besser ist es natürlich, wenn auf diese Weise ein Zeilenanker ausgeklammert werden kann.

  

<< zurück vor >>

 

 

 

Tipp der data2type-Redaktion:
Zum Thema Reguläre Ausdrücke bieten wir auch folgende Schulungen zur Vertiefung und professionellen Fortbildung an:
   

Copyright der deutschen Ausgabe © 2008 by O’Reilly Verlag GmbH & Co. KG
Für Ihren privaten Gebrauch dürfen Sie die Online-Version ausdrucken.
Ansonsten unterliegt dieses Kapitel aus dem Buch "Reguläre Ausdrücke" denselben Bestimmungen, wie die gebundene Ausgabe: Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Alle Rechte vorbehalten einschließlich der Vervielfältigung, Übersetzung, Mikroverfilmung sowie Einspeicherung und Verarbeitung in elektronischen Systemen.

O’Reilly Verlag GmbH & Co. KG, Balthasarstr. 81, 50670 Köln