Deep Learning for Computer Vision

In diesem Kurs für Fortgeschrittene werden die Prinzipien, Techniken und Anwendungen des tiefgehenden Lernens in Computer Vision behandelt. Die Teilnehmer lernen, wie man neuronale Netze für die Bildklassifizierung, Objekterkennung, semantische Segmentierung und andere Computer-Vision-Aufgaben entwickelt, trainiert und validiert. Es werden auch Techniken zur Verbesserung der Leistung von Deep-Learning-Modellen und Veranschaulichungen behandelt, um Anhaltspunkte für die weitere Modellentwicklung zu erhalten. Am Ende des Kurses werden die Studierenden in der Lage sein, Deep-Learning-Techniken anzuwenden, um reale Probleme in verschiedenen Bereichen zu lösen.

Der Kurs wird über die Lernplattform Moodle verwaltet. Alle Dokumente und weitere Informationen finden Sie im Moodle-Kurs Deep Learning for Computer Vision SoSe2024.

Bitte beachten Sie: Die Unterlagen zu unseren Vorlesungen und Übungen sind nur aus dem Netzwerk der Bauhaus-Universität Weimar erreichbar.

Integrierte Vorlesung

Vorlesungen

  1. Organisation, Geschichte und Perzeptron
  2. Optimierung und Regularisierung
  3. Neuronale Faltungsnetze
  4. Bildklassifikation und Transferlernen
  5. Architekturen
  6. Transformer
  7. Objekterkennung
  8. Semantische und instanzielle Segmentierung
  9. Probabilistische generative Modelle
  10. Tiefgehendes Lernen für die Bildzuordnung
  11. 3D-Deep-Learning Anwendungen I
  12. 3D-Deep-Learning Anwendungen II

Übungen

  1. Rückpropagierung und Python-Projektmanagement
  2. Laden von Daten, Modellarchitektur, Training und Auswertung
  3. Kaggle, reale Trainingszeiten, Netzanpassung und empirisches Arbeiten
  4. Modulares Netzwerkdesign, Tensorformen und Objekterkennung

Projekt

  1. Phase 1. individueller Projektteil
  2. Phase 2. Team-Projektteil
  3. Projektpräsentation

Prüfung

Klausur

  • Termin: 29. Juli 2024, 9:00 Uhr
  • Ort: SR 3.31 in der S143
  • Hilfsmittel: keine

Klausurvorbereitung

  • Alte Klausurbeispiele