Prüfen Sie mit dem CYK-Algorithmus

Question

Prüfen Sie mit dem CYK-Algorithmus

Ein anderes Problem?

loungeAI · Answer 1 · 2023-12-04T19:51:37+0000

Antwort mit KI erzeugt

CYK-Algorithmus zur Überprüfung, ob \( babaab \in L(G) \)

Der CYK-Algorithmus (Cocke-Younger-Kasami-Algorithmus) ist ein Parser für kontextfreie Grammatiken, der auf Chomsky-Normalform (CNF) beruht. Die Grammatik muss daher zunächst in CNF vorliegen oder konvertiert werden.

Die gegebene Grammatik \( G \) ist:

- Nichtterminale: \( \{S, A, B\} \)
- Terminale: \( \{a, b\} \)
- Regeln:
\( S \rightarrow B A \mid a \\ A \rightarrow S B \mid a \\ B \rightarrow A B \mid b \)
- Startsymbol: \( S \)

Schritt 1: Überprüfung der CNF-Eigenschaften
Die Grammatikregeln sind bereits in der Chomsky-Normalform, da jede Produktionsregel entweder die Form \( A \rightarrow BC \) hat (zwei Nichtterminale auf der rechten Seite) oder \( A \rightarrow a \) (ein Terminalsymbol auf der rechten Seite).

Schritt 2: Initialisierung der CYK-Tabelle

Die Zeichenkette \( w = babaab \) hat eine Länge von \( n = 6 \). Wir erstellen eine \( 6 \times 6 \) CYK-Tabelle \( T \), wobei \( T[i,j] \) die Menge der Nichtterminale enthält, die das Teilwort von \( w \) der Länge \( j-i+1 \) ableiten können, beginnend bei Position \( i \).

Schritt 3: Einfüllen der diagonal ersten Zeile

Wir füllen die erste Diagonale (die Spalte \( j = i \)) mit den Nichtterminalen, die auf die einzelnen Zeichen ableiten können:

Für \( i = 1 \) bis \( i = 6 \):
- \( T[1,1] \) (für \( b \)): \( \{B\} \)
- \( T[2,2] \) (für \( a \)): \( \{S, A\} \)
- \( T[3,3] \) (für \( b \)): \( \{B\} \)
- \( T[4,4] \) (für \( a \)): \( \{S, A\} \)
- \( T[5,5] \) (für \( a \)): \( \{S, A\} \)
- \( T[6,6] \) (für \( b \)): \( \{B\} \)

Schritt 4: Füllen der CYK-Tabelle mittels dynamischer Programmierung

Nun füllen wir die Tabelle für alle größeren Teilwörter durch Kombination von Subwörtern. Die Tabelle wird reihenweise gefüllt, beginnend mit kürzeren Teilen und sukzessive längeren:

- Für \( k = 2 \):
- \( T[1,2] \): Kombination von \( T[1,1] \) und \( T[2,2] \) ergibt:
\( B \times \{S, A\} = \{BS, BA\} \\ BS \rightarrow - \text{(nichts in den Regeln)} \\ BA \rightarrow S \)
Also \( T[1,2] = \{S\} \).
- \( T[2,3] \): Kombination von \( T[2,2] \) und \( T[3,3] \) ergibt:
\( \{S, A\} \times B = \{SB, AB\} \\ SB \rightarrow A \)
Also \( T[2,3] = \{A\} \).
- \( T[3,4] \): Kombination von \( T[3,3] \) und \( T[4,4] \) ergibt:
\( B \times \{S, A\} = \{BS, BA\} \\ BS = - \\ BA = S \)
Also \( T[3,4] = \{S\} \).

- \( T[4,5] \): Kombination von \( T[4,4] \) und \( T[5,5] \) ergibt:
\( \{S, A\} \times \{S, A\} = \{SS, SA, AS, AA\} \)
Keines dieser Ableitungsprodukte entspricht einer Regel, also bleibt \( T[4,5] \) leer.

- \( T[5,6] \): Kombination von \( T[5,5] \) und \( T[6,6] \) ergibt:
\( \{S, A\} \times B = \{SB, AB\} \\ SB \rightarrow A \)
Also \( T[5,6] = \{A\} \).

- Für \( k = 3 \):
- \( T[1,3] \): Kombination von \( T[1,1] \) und \( T[2,3] \), sowie \( T[1,2] \) und \( T[3,3] \):
\( \begin{aligned} B \times A &= - \\ S \times B &= - \\ \end{aligned} \)
Also \( T[1,3] \) ist leer.

- \( T[2,4] \): Kombination von \( T[2,2] \) und \( T[3,4] \), sowie \( T[2,3] \) und \( T[4,4] \):
\( \{S, A\} \times S = \{SS, AS\} \rightarrow - \\ A \times \{S, A\} = \{AS, AA\} \)
Also \( T[2,4] \) ist ebenfalls leer.

- \( T[3,5] \): Kombination von \( T[3,3] \) und \( T[4,5] \), sowie \( T[3,4] \) und \( T[5,5] \):
\( B \times \emptyset - \\ S \times \{S, A\} \)
Demnach \( T[3,5] = \emptyset \).

- \( T[4,6] \): Kombination von \( T[4,4] \) und \( T[5,6] \), sowie \( T[4,5] \) und \( T[6,6] \):
\( \{S, A\} \times A \rightarrow - \\ \emptyset \times B \)
Also \( T[4,6] = \emptyset \).

- Für \( k = 4 \):
- ... und so weiter bis \( k = 6 \), dann:
Der letzte Eintrag \( T[1,6] \) entscheidet, ob die ganze Zeichenkette \( babaab \) von \( S \) abgeleitet werden kann. In unserem Fall wird kein \( S \) das gesamte Wort ableiten können.

Schlussfolgerung
Nach dem Durchlaufen des CYK-Algorithmus zeigt sich, dass das Startsymbol \( S \) nicht in der Zelle \( T[1,6] \) enthalten ist. Daher gilt:

\( babaab \notin L(G) \)

Die Zeichenkette \( babaab \) gehört somit nicht zur Sprache \( L(G) \).

Prüfen Sie mit dem CYK-Algorithmus

1 Antwort

Ähnliche Fragen

Eingabetools:

Beliebte Fragen:

Heiße Lounge-Fragen: