Regular Expression Definition

Was ist Regular Expression?

Ein regulärer Ausdruck (oder „regex“) ist ein Suchmuster, das für den Abgleich eines oder mehrerer Zeichen innerhalb einer Zeichenfolge verwendet wird. Es kann mit bestimmten Zeichen, Platzhaltern und Zeichenbereichen übereinstimmen. Reguläre Ausdrücke wurden ursprünglich von Unix-Dienstprogrammen wie vi und grep verwendet. Inzwischen werden sie jedoch von vielen Anwendungen zur Codebearbeitung und Wortverarbeitungsprogrammen auf verschiedenen Plattformen unterstützt. Reguläre Ausdrücke können auch in den meisten wichtigen Programmiersprachen verwendet werden.

Ein regulärer Ausdruck kann so einfach sein wie eine einfache Zeichenkette, z. B. „app“. Der reguläre Ausdruck „app“ würde auf Zeichenfolgen passen, die die Wörter „apps“, „applications“ und „inapplicable“ enthalten. Ein regulärer Ausdruck kann auch Ankerzeichen („^“ und „$“) enthalten, die verwendet werden, um den Anfang bzw. das Ende einer Zeile anzugeben. Daher würde die Regex „^apps“ mit der Zeichenfolge „Apps sind toll“ übereinstimmen, aber nicht mit der Zeichenfolge „Ich mag Apps“.

Reguläre Ausdrücke können Bindestriche enthalten, die verwendet werden, um einen Bereich von Zeichen, wie z. B. alle Kleinbuchstaben, abzugleichen. Der Regex „[a-z]“ würde zum Beispiel mit „Apps“ übereinstimmen, aber nicht mit den Zeichenfolgen „Apps“ oder „123“. Die Regex „[A-Za-z]“ würde mit „Apps“ übereinstimmen und „[0-9]“ würde mit „123“ übereinstimmen. Ein Punkt, der das Standardzeichen Wildcard in regulären Ausdrücken ist, kann für jedes beliebige Zeichen verwendet werden (außer für ein Zeilenendezeichen). Ein Punkt, gefolgt von einem Stern (.*), passt auf null oder mehr Instanzen, während ein Punkt, gefolgt von einem Plus (.+), auf eine oder mehrere Instanzen passt.

Was passiert nun, wenn Sie eine Zeichenfolge abgleichen müssen, die einen Bindestrich, einen Stern, ein Plus oder ein Ankerzeichen enthält? Diese Zeichen können in ein Muster für einen regulären Ausdruck aufgenommen werden, indem man sie mit einem umgekehrten Schrägstrich („\“) „entschärft“. Um zum Beispiel nach „$0,99“ zu suchen, würde der Regex wie „\$0\.99“ aussehen. Backslashes werden auch für die Suche nach nicht druckbaren Zeichen verwendet. Zum Beispiel passt „\r“ zu einem Wagenrücklauf, „\n“ zu einem Zeilenumbruch und „\t“ zu einem Tabulatorzeichen.

Während es nicht viel Mühe kostet, einen einfachen regulären Ausdruck zu erstellen, ist das Schreiben einer fortgeschrittenen Regex keine leichte Aufgabe. Selbst die besten Programmierer schaffen es selten, komplexe reguläre Ausdrücke auf Anhieb richtig zu schreiben. Bei richtiger Anwendung sind reguläre Ausdrücke jedoch ein leistungsfähiges Werkzeug zum Suchen, Finden und Ersetzen von bestimmtem Text.

Die Definition von Regular Expression auf dieser Seite ist eine Originaldefinition von SharTec.eu.
Das Ziel von SharTec ist es, Computerterminologie so zu erklären, dass sie leicht zu verstehen ist. Wir bemühen uns bei jeder von uns veröffentlichten Definition um Einfachheit und Genauigkeit. Wenn Sie Feedback zur Regulärer Ausdruck-Definition haben oder einen neuen Fachbegriff vorschlagen möchten, kontaktieren Sie uns bitte.