Verlinkung

Eine kurze Einblick in die Grundlagen generativer KI bietet unser Kurs "KI-Kompass" der TIB
Schaut gerne rein und erfahrt, was sich dahinter verbirgt: Kurz, knapp und kompakt. Auch zum Thema Nachhaltigkeit und Ethik

Die unteren Videos geben dir einen guten Einblick in die Funktionsweise von Sprachmodellen und Bildgenerierungsverfahren.

Sprachmodelle 

ChatGPT, Gemini, Claude & Co erklärt: Wie Maschinen Sprache verstehen | Terra X Lesch & Co

Bildgenerierungsmodelle 

Wie KI Bilder malt – das Geheimnis von Stable Diffusion | DE/CODED | Terra X Lesch & Co

Ähnlich wie bekannte Bildgenerierungsmodelle basiert auch  die Videogenerierung von Google (Veo) und OpenAI  (Sora) auf ein Diffusionsmodell.

Ein Diffusionsmodell funktioniert nach dem Prinzip der schrittweisen Rauschunterdrückung. Stelle dir eine Art Bildhauer vor, der aus einem Block Rauschen (dem "Marmor") eine Figur herausarbeitet. 

Der Prozess unterteilt sich in zwei Hauptphasen:  Einem Vorwärtsprozess und einem Rückwärtsprozess, der eigentlichen Generierung.

Der Vorwärtsprozess (Training) 
In dieser Phase lernt die KI, wie "Zerstörung" funktioniert: 

  • Einem klaren Bild aus dem Datensatz wird in vielen kleinen Schritten zufälliges Rauschen hinzugefügt.
  • Am Ende ist das ursprüngliche Bild nicht mehr erkennbar – es ist nur noch "statisches Rauschen" (wie das Flimmern eines alten Fernsehers).
  • Die KI schaut sich jeden dieser Schritte genau an und lernt die mathematische Regel: "Wie viel Rauschen wurde hier gerade hinzugefügt?"

Der Rückwärtsprozess (Generierung)
Hier passiert die eigentliche Magie. Wenn du einen Befehl (Prompt) eingibst, dreht die KI den Prozess um:

  • Startpunkt: Die KI beginnt mit einem Feld aus völlig zufälligem Rauschen.
  • Schrittweise Bereinigung: Basierend auf deinem Prompt (z. B. "Ein Hund im Park") schätzt das Modell in jedem Schritt, welcher Teil des Rauschens "falsch" ist, und entfernt ihn.
Entstehung des Bildes: Aus dem Chaos treten langsam Konturen hervor, dann Farben und schließlich die feine Details, bis ein deutliches Bild - wie wir es bei der Bildgenerierung kennen. Ein weitere Erklärung findest du beim Fachmagazin t3n.


Tiefer einsteigen?

Möchtest du dich weitere mit KI beschäftigen und neue Entwicklungen im Blick haben?
Hier eine kleine Auswahl von Fachportalen/Newsletters und Podcasts:

Einige haben auch einen direkt Bezug zu Lernmedien

Podcast

Kennst du weitere spannende Seiten oder Video/ Audio-Podcast, schreibe uns gerne 🙂
Darüber hinaus bietet der KI Campus weitere verschiedene Lernangebot rund um das Thema.
Dort findet ihr auch einen Kurs "Prompt-Labor: Generative KI in der Hochschullehre Anwendungen".

Zuletzt geändert: Montag, 26. Januar 2026, 14:29