Grammatiken

Wir verstehen Sprachen als Mengen der syntaktisch korrekten Strings über einem Alphabet. Das Vokabular bildet eine Grundlage von Sprachen. Das Vokabular kann direkt angegeben werden z.B. in Wörterbüchern oder als elektronisches Verzeichnis, aber es ergibt sich auch indirekt aus den Sätzen der Sprache. Im Verzeichnis sind dann neben dem Wort auch Informationen zu seinem Gebrauch z.B. die Wortart vermerkt. Kompetente Sprecher können intuitiv einen syntaktisch korrekten von einem syntaktisch auffälligem Satz unterscheiden. Für andere Sprachen - künstliche, wie natürliche - muss dieses Wissen erworben werden. Oft geschieht dies durch explizites Regellernen.

Beispiele für Sprachen

Sprache₁ = {11.11.11, 19.9.1991, 20.02.2002, 29.2.92}

Sprache₂ = {x | x ist eine Folge von einem Vorzeichen und einer oder mehrerer Ziffern}

Sprache_2' = {x | x ist eine Folge von einem Vorzeichen und einer oder mehrerer Ziffern, allerdings ist die Null besonders: zur Sprache gehört die '0' (ohne Vorzeichen), außerdem darf auf ein Vorzeichen keine Null folgen und mehrere Nullen hintereinander kann es nur geben, wenn davor mindestens eine von Null veschiedene Ziffer steht.}

Sprache_2'' = {x | x ist eine Folge von
Vorzeichen Ziffer(ohne Null) beliebg. Anz. weiterer Ziffern(mit Null)
oder
Null }

Sprache₃ = {w | w ist eine Folge von

	Artikel		Nomen
oder	Artikel	Adjektiv	Nomen
oder		Adjektiv	Nomen
oder	Artikel		Nomen	Relativsatz
		...		}

Sprache₄ = {w | w ist eine Folge von

	X		Z
oder	X	Y	Z
oder		Y	Z
oder	X		Z	R
		...		}

Verschiedene Darstellungsformen von Mengen sind uns bereits bekannt. Wir könnten die Elemente einer Sprache aufzählen (Sprache₁).

Eine andere Möglichkeit besteht darin, die Elemente der Sprache durch die Angabe ihrer Eigenschaften herauszufiltern (Sprache₂). Dieses Beispiel beschreibt auf sehr unzureichende Art die Menge der ganzen Zahlen. Sie enthält Zahlen wie -0000023 oder +0, die uns wie Zahlen aus den Anfangszeiten der Taschenrechner vorkommen.

Man kann versuchen, sich genauer auszudrücken, um solche Fälle auszuschließen (Sprache_2'). Diese Darstellung ist bereits sehr unübersichtlich. Ein Computer, der auf diese Weise die ganzen Zahlen erkennen soll, müsste erst einmal Deutsch können. Aufgrund von Mehrdeutigkeiten in natürlichen Sprachen könnten sich außerdem bei einer solchen Darstellung Ungenauigkeiten ergeben.

Etwas übersichtlicher sind die Sprachen 2'' und 3. Sprache_2'' vereinfacht Sprache_2'. Sprache₃ beschreibt in Ansätzen in welchen Kontexten Nomen (Substantive) vorkommen können. Vereinfachend steht Artikel für {der, die, das, des, dem, den, ein, eine, eines, einer, ...}, Adjektiv für {klein, kleine, kleiner, ..., groß, ...}, Nomen für {Computer, Sprache, Sprachen, ...}. Dabei wird in der Beschreibung der Menge die nötige Kongruenz zwischen den einzelnen Wörtern nicht beachtet.

Die verwendeten Bezeichner Adjektiv, Artikel und Nomen sind völlig willkürlich festgelegt und müssten genauer erklärt werden. Sprache 4 beschreibt die gleichen Abhängigkeiten, jedoch wurden die Bezeichner willkürlich gewählt. Aufgrund der Lesbarkeit wird man jedoch erste Darstellung der zweiten Darstellung bevorzugen.

Einen weiteren Nachteil hat die einfache Darstellung von Sprachen als Mengen: Die Struktur der einzelnen Sätze einer Sprache wird nicht sehr deutlich.

2.1.1 Sprachen als Mengen