Audio- und Videotechnik

Foto: Prof. Dr. rer. nat. Stefan Bischoff
Ihr Ansprechpartner
Prof. Dr. rer. nat.
Stefan Bischoff
Fakultät Elektrotechnik und Informatik
02763 Zittau
Schwenninger Weg 1
Gebäude Z VII, Raum 413
+49 3583 612-4868
+49 3583 612-4868

Wintersemester: Vorlesung:  2 SWS
Abschlußleistung: Mündliche Prüfung
Zulassungsvoraussetzung zur Prüfung:
Erfolgreiche Teilnahme an der Lehrveranstaltung Audio-Videotechnik

Bilder, Tabellen,Diagramme u.s.w. im pdf-Format

Einleitung

  • Physiologie des Hörens und Sehens, Bild- und Tonsignale
  • Datenerfassung und Repräsentation im Rechner
  • Ortsdiskretisierung, Quantisierung, Farb- und Zeitdiskretisierung
  • Farbräume (RGB, CMYK, YUV, HSV)
  • Mathematische Beschreibung

Vorverarbeitung I

  • Grauwertskalierung
  • Geometrische Korrektur
  • Kamerakalibrierung

Vorverarbeitung II

  • Faltung im Zeit- und im Frequenzbereich
  • Masken- und Filtertechniken, Denoising
  • Morphologische Operationen
  • Differentialoperatoren, Kantenextraktion (Edge-Detection)

Kompression I

  • Verlustfreie und verlustbehaftete Kompression
    BMP, JPEG, JPEG2000

Kompression II

  • Videokompressionsmethoden
  • MPEG 4, H264
  • Audiokompression
  • MP3

Segmentierung I

  • Histogrammbasierte Verfahren
  • Punkt-, Kanten- und Regionenorientierte Verfahren
  • Wissensbasierte Verfahren, Hough-Transformation
  • Template Matching, Active Contour Snakes

Segmentierung II

  • Bewegtsegmentierung
  • Background Subtraction, Optischer Fluß
  • Sprachsegmentierung

Merkmalsextraktion

  • Farb-, Textur- und Formdeskriptoren
  • Principle Component Analysis (PCA)
  • Videodeskriptoren
  • Audiodeskriptoren

Klassifikation I

  • Grundlagen der Klassifikation
  • Prototypen, Clusteranalyse
  • Abstandsbasierte Klassifikation: KNN
  • Statistische Verfahren
  • Bayesscher Klassifikator

Klassifikation II

  • Spracherkennung
  • Hidden-Markov-Modell
  • Dynamische Programmierung, Viterbi-Algorithmus

Lernfähige Klassifikation

  • Methoden des Maschinellen Lernens
  • Überwachtes und unüberwachtes Lernen
  • Künstliche Neuronale Netze, Perceptron, MLP
  • Support-Vector-Machine (SVM)

Multisensorik

  • Multisensorfusion zur Erhöhung der Erkennungsraten
  • TOF-Tiefensensoren
  • Stereo, 3d-Szenenrekonstruktion
  • 3D-Brillen, Anaglyph, 3D-Shutter-Brillen
  • 3D-Displays

Wichtige Anwendungen: Optische Qualitätskontrolle in der Produktion Robotik, Automotive Bereich Medizinische Diagnostik Videokonferenzsysteme Biometrie Security