Musteranalyse mit Hidden Markov Modellen (Spezielle Musteranalysesysteme)

Musteranalyse mit Hidden Markov Modellen
(Spezielle Musteranalysesysteme)

VORLESUNG im WINTERSEMESTER 2017

Vorlesung Fr 10-12 im SR 130 CZ3

Prof. Dr. E.G. Schukat-Talamazzini

Einfache Muster & numerische Klassifikation.
In der Vorlesung Mustererkennung wurden vorrangig einfache Muster betrachtet, die als reellwertige Merkmalvektoren fester Dimension repräsentiert sind. Die maschinelle Interpretation einfacher Muster besteht in der Zuordnung eines von endlich vielen Klassennamen auf Grundlage der Bayes-Entscheidungsregel; Beispiele solcher numerischer Klassifikatoren sind Normalverteilungsklassifikatoren, Mehrschichtperzeptren, Supportvektormaschinen und binäre Entscheidungsbäume.

Komplexe Muster & Musteranalyse.
Viele Muster besitzen eine zeitliche Dimension (Schallsignale, Schriftzüge) oder erstrecken sich in eine, zwei oder mehr Raumkoordinaten (Bohrkerne, Video- oder MRI-Aufnahmen). Diese physikalische Strukturierung sprengt den Rahmen der Merkmalvektorrepräsentation, die Ausgang obiger Klassifikationstechniken war. Die kompositionelle Struktur eines komplexen Musters schlägt sich aber auch in seiner zu analysierenden Bedeutung nieder; statt Klassennamen eines endlichen Alphabets sind als symbolische Beschreibung jetzt segmental oder hierarchisch gestaffelte formalsprachliche Ausdrücke gefordert.

Hidden Markov Modelle (HMM).
Für die stochastische Modellierung eindimensionaler Muster (Schrift, Sprache, Text, DNA) hat sich das HMM als de facto Standard etabliert. Wir kennen mittlerweile Varianten für symbolische wie (multivariat-) numerische Sequenzdaten (DD/CD-HMM), hierarchisch oder rekursiv verschachtelte Erweiterungen (RMM; SCFG), generative und diskriminative Lernverfahren (ML; ME; ANN-Hybrid), Inferenzmethoden zur Segmentierung, Annotierung, Lokalisierung, Konzeptformierung, Resynthese, Übersetzung und vieles mehr.

Vorlesungsinhalt.
Theorie der HMM (Ausgabeverteilungen, Lern- und Dekodierverfahren) · Isadora-System (RMM, Zustandsvernetzung, abgeleitete Ausgabeverteilungen, RVA/RBWA, symbol. Beschreibung) · Modellierung gesprochenener Sprache · Modellierung geschriebener Sprache (Handschrift, Fließschrift, Kfz-Kennzeichen) · Motive in Nukleinsäureketten
Wegen des geringen SWS-Umfangs gibt es keine begleitende Übungsveranstaltung.

Die Lehrveranstaltung richtet sich an Studierende des Masterstudiengangs Informatik.

Erster Vorlesungstermin ist Freitag, der 20. Oktober 2017 .





E.G. Schukat-Talamazzini Institut für Informatik Fakultät Mathe/Inf FSU Jena 16.08.2017 - 10:54 E-Mail