Literalen Text herausstellen
(Auszug aus "Reguläre Ausdrücke" von Jeffrey E. F. Friedl)
Viele der internen Optimierungen hängen davon ab, ob die Regex-Maschine feststellen kann, dass in einem Treffer ein Stück literaler Text vorkommen muss. Manche Maschinen sind da geschickter als andere. Wenn man literalen Text auch für die Regex-Maschine besser erkennbar macht, wird die Möglichkeit zur Optimierung eher erkannt.
Mindestanzahl bei Quantoren ausklammern
Wenn ˹xx*˼ statt ˹x+˼ geschrieben wird, wird klar, dass zumindest ein ›x‹ in jedem Treffer vorkommen muss. Die gleiche Art von Überlegung führt von ˹-{5,7}˼ zu ˹------{0,2}˼.
Gemeinsame Teile der Alternation ausklammern
Wenn statt ˹(?:klipp|klar)˼ die ausgeklammerte Form ˹kl(?:ipp|ar)˼ benutzt wird, kann die Maschine eher erkennen, dass in jedem Fall ein ›kl‹ im Treffer vorkommen muss. Man kann auch auf der rechten Seite ausklammern, z.B. bei ˹(?:Optim|Standardis)ierung˼. Noch besser ist es natürlich, wenn auf diese Weise ein Zeilenanker ausgeklammert werden kann.
<< zurück | vor >> |
Tipp der data2type-Redaktion: Zum Thema Reguläre Ausdrücke bieten wir auch folgende Schulungen zur Vertiefung und professionellen Fortbildung an: |
Copyright der deutschen Ausgabe © 2008 by O’Reilly Verlag GmbH & Co. KG
Für Ihren privaten Gebrauch dürfen Sie die Online-Version ausdrucken.
Ansonsten unterliegt dieses Kapitel aus dem Buch "Reguläre Ausdrücke" denselben Bestimmungen, wie die gebundene Ausgabe: Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Alle Rechte vorbehalten einschließlich der Vervielfältigung, Übersetzung, Mikroverfilmung sowie Einspeicherung und Verarbeitung in elektronischen Systemen.
O’Reilly Verlag GmbH & Co. KG, Balthasarstr. 81, 50670 Köln