VORLESUNG im WINTERSEMESTER 2011
Vorlesung Fr 10-12 im SR 123 CZ
Prof. Dr. E.G. Schukat-Talamazzini
Einfache Muster & numerische Klassifikation.
In der Vorlesung Mustererkennung
wurden vorrangig einfache Muster betrachtet,
die als reellwertige Merkmalvektoren fester Dimension
repräsentiert sind.
Die maschinelle Interpretation einfacher Muster
besteht in der Zuordnung eines von endlich vielen Klassennamen
auf Grundlage der Bayes-Entscheidungsregel;
Beispiele solcher numerischer Klassifikatoren
sind Normalverteilungsklassifikatoren,
Mehrschichtperzeptren,
Supportvektormaschinen und
binäre Entscheidungsbäume.
Komplexe Muster & Musteranalyse.
Viele Muster besitzen eine zeitliche Dimension
(Schallsignale, Schriftzüge)
oder erstrecken sich in eine, zwei oder mehr Raumkoordinaten
(Bohrkerne, Video- oder MRI-Aufnahmen).
Diese physikalische Strukturierung
sprengt den Rahmen der Merkmalvektorrepräsentation,
die Ausgang obiger Klassifikationstechniken war.
Die kompositionelle Struktur eines komplexen Musters
schlägt sich aber auch in seiner zu analysierenden Bedeutung nieder;
statt Klassennamen eines endlichen Alphabets
sind als symbolische Beschreibung
jetzt segmental oder hierarchisch gestaffelte
formalsprachliche Ausdrücke gefordert.
Hidden Markov Modelle (HMM).
Für die stochastische Modellierung eindimensionaler Muster
(Schrift, Sprache, Text, DNA)
hat sich das HMM als de facto Standard etabliert.
Wir kennen mittlerweile Varianten
für symbolische wie (multivariat-) numerische Sequenzdaten
(DD/CD-HMM),
hierarchisch oder rekursiv verschachtelte Erweiterungen
(RMM; SCFG),
generative und diskriminative Lernverfahren
(ML; ME; ANN-Hybrid),
Inferenzmethoden
zur Segmentierung, Annotierung,
Lokalisierung, Konzeptformierung,
Resynthese, Übersetzung
und vieles mehr.
Vorlesungsinhalt.
Theorie der HMM
(Ausgabeverteilungen, Lern- und Dekodierverfahren)
· Isadora-System
(RMM, Zustandsvernetzung, abgeleitete Ausgabeverteilungen,
RVA/RBWA, symbol. Beschreibung)
· Modellierung gesprochenener Sprache
· Modellierung geschriebener Sprache
(Handschrift, Fließschrift, Kfz-Kennzeichen)
· Motive in Nukleinsäureketten
Wegen des geringen SWS-Umfangs
gibt es keine begleitende Übungsveranstaltung.
Zur praxisnahen Illustration
werden aber
im Linuxpool lauffähige
Isadora-Demonstrationen
als HMM-Anwendungsbeispiele
zur Verfügung gestellt.
Die Lehrveranstaltung richtet sich an Studierende
des Masterstudiengangs Informatik
und der Diplomstudiengänge
Informatik und Bioinformatik (D5).
| E.G. Schukat-Talamazzini | Institut für Informatik | Fakultät Mathe/Inf | FSU | Jena | 29.08.2011 - 11:32 |