Stochastische Grammatikmodelle

Stochastische Grammatikmodelle

VORLESUNG im WINTERSEMESTER 2011

Vorlesung Mo 08-10 im SR 227 CZ und Mi 10-12 im SR 123 CZ

Prof. Dr. E.G. Schukat-Talamazzini

Grammatische Modelle natürlicher Sprachen sind unverzichtbare Bestandteile maschineller Systeme

Methoden des automatischen Lernens stochastischer Grammatiken aus Datensammlungen werden längst aber auch im Bereich künstlicher Sprachen eingesetzt -- die bekannteste Anwendung ist die Modellierung der Primärstruktur genomischer Sequenzen als Sprache über dem Nuklein- oder Aminosäurealphabet.

Die Lehrveranstaltung gliedert sich in drei Teile.

  1. Im ersten Teil werden -- nach einer kurzen Zusammenstellung wissenswerter Details über formale Sprachen, Grammatiken, Automaten -- einige traditionelle Systeme schwach kontextfreier Sprachen (Index-, Baumadjunktions-, Kopf-, Kategorial- und linksassoziative Grammatiken) vorgestellt.
  2. Statistische Lernverfahren für die Grammatiken natürlicher Sprachen bilden dann den zweiten Teil der angekündigten Vorlesung. Als Vorbereitung dient eine sehr umfassende Darstellung von Schätzverfahren für diskrete Wahrscheinlichkeitsverteilungen, an die sich die Behandlung von N-Gramm-Sprachmodellen sowie von Methoden zur automatischen Wortkategorisierung und zur Modellierung weitgespannter Wortabhängigkeiten (insbesondere kontextfreie stochastische Grammatiken) anschließt.
  3. Im anwendungsorientierten dritten Teil schließlich werden korpuslinguistische Methoden, Systeme des Information Retrieval und Verfahren der Maschinellen Übersetzung behandelt.

Die Lehrveranstaltung richtet sich an Studierende der Masterstudiengänge Informatik, Bioinformatik und Computational Science und der Diplomstudiengänge Informatik und Bioinformatik (D1, D5).





E.G. Schukat-Talamazzini Institut für Informatik Fakultät Mathe/Inf FSU Jena 29.08.2011 - 11:30 E-Mail