Vorlesung
Mo 08-10 im SR 227 CZ
und
Mi 10-12 im SR 123 CZ
Prof. Dr. E.G. Schukat-Talamazzini
Grammatische Modelle natürlicher Sprachen
sind unverzichtbare Bestandteile maschineller Systeme
zur Übersetzung und Bedeutungsanalyse von Texten,
zur stichwortbezogenen Suche nach Informationen
in textuellen Wissensbasen
wie Volltext-Literaturdatenbanken oder auch dem World Wide Web
sowie zur sensorischen Erkennung
gedruckter, handgeschriebener oder gesprochener Eingaben.
Methoden des automatischen Lernens
stochastischer Grammatiken
aus Datensammlungen
werden längst aber auch im Bereich künstlicher Sprachen eingesetzt --
die bekannteste Anwendung ist die Modellierung
der Primärstruktur genomischer Sequenzen
als Sprache über dem Nuklein- oder Aminosäurealphabet.
Die Lehrveranstaltung gliedert sich in drei Teile.
Im ersten Teil werden
-- nach einer kurzen Zusammenstellung wissenswerter Details
über formale Sprachen, Grammatiken, Automaten --
einige traditionelle Systeme schwach kontextfreier Sprachen
(Index-, Baumadjunktions-, Kopf-, Kategorial- und linksassoziative Grammatiken)
vorgestellt.
Statistische Lernverfahren für die Grammatiken natürlicher Sprachen
bilden dann den zweiten Teil der angekündigten Vorlesung.
Als Vorbereitung dient eine sehr umfassende Darstellung
von Schätzverfahren für diskrete Wahrscheinlichkeitsverteilungen,
an die sich die Behandlung von N-Gramm-Sprachmodellen
sowie von Methoden zur automatischen Wortkategorisierung
und zur Modellierung weitgespannter Wortabhängigkeiten
(insbesondere kontextfreie stochastische Grammatiken)
anschließt.
Im anwendungsorientierten dritten Teil
schließlich
werden korpuslinguistische Methoden,
Systeme des Information Retrieval und
Verfahren der Maschinellen Übersetzung
behandelt.
Die Lehrveranstaltung richtet sich an Studierende
der Masterstudiengänge
Informatik, Bioinformatik und Computational Science
und der Diplomstudiengänge
Informatik und Bioinformatik (D1, D5).