Überblick

Früher wurden Texte von realen Personen eingesprochen oder vor der Kamera präsentiert. Heute können dafür auch KI-Avatare – sogenannte Stellvertreter – eingesetzt werden. Sie ermöglichen eine gezielte und direkte Ansprache der jeweiligen Zielgruppe. Ob der Einsatz eines Avatars sinnvoll ist, sollte jedoch sorgfältig abgewogen werden.

Grafik

Kompetenzen

  • KI-Avatare erstellen und anpassen, um Inhalte in Lernvideos darzustellen
  • Auswahl und Einsatz von Avataren an den Videozweck anpassen
  • Nutzung von Avataren unter Berücksichtigung von Datenschutz und ethischen Aspekten planen.
Einsatzmöglichkeiten von KI-Avataren

Zu Beginn der Entstehung von KI-Avataren lag der Fokus besonders auf dem Marketingbereich und der Erstellung on Sales- und Recruiting-Videos. Mittlerweile finden KI-Avatare jedoch auch in der Produktion von Lehr-/ Lernvideos oder in wissenschaftlichen Formaten Anwendung.

Hier ein Beispiel: In der Lehrvideoreihe "Physik Denken" (Experimentalphysik 2 - Felder und Wellen) von Martin Erdmann werden ebenfalls Avatare eingesetzt:

    

Beispiel: Lehrvideoreihe mit KI-Avataren

Grundlagen der Avatar-Erstellung

Auf der Grundlage eines Skripts generiert die KI eine virtuelle Präsentationsfigur (Presenter) und imitiert menschlich wirkende Bewegungen, die lippensynchron zur generierten Stimme erfolgen. So entsteht eine künstlich erzeugte Person, die die Zuschauenden direkt adressiert und Inhalte verbal vermittelt.

Für die Erstellung werden – vereinfacht gesagt – verschiedene generative Modelle kombiniert, die nacheinander angewandt werden:

Der fertige Avatar kann anschließend mit zusätzlichem Material angereichert werden, beispielsweise durch Einbettung in ein Bild mit transparentem Hintergrund (z. B. eine Infografik) oder in ein virtuell generiertes Setting (z. B. ein Büro). Je nach Anforderung an das Video sind verschiedene Gestaltungsoptionen möglich.

Vorteile des Avatar-Einsatzes

Ein wesentlicher Vorteil von KI-Avataren ist die Zeit- und Ressourcen-Ersparnis. Die Aufzeichnung einer Person vor der Kamera entfällt – ebenso der damit verbundene Aufwand für Vorbereitung, Aufbau und Gestaltung (Kamera, Licht, Ton).

Darüber hinaus ermöglicht der Einsatz von Avataren eine Standardisierung des Produktionsprozesses. Dadurch bleibt die Qualität der Videos gleichbleibend hoch, unabhängig von Tagesform oder Stimmung einer realen Person vor der Kamera. Ein Avatar liefert stets dieselbe Leistung – ähnlich wie bei synthetischen Stimmen (Voice Generierung).

Generierung und Anpassung

Technisch können Avatare auf unterschiedliche Weise erstellt, genutzt und angepasst werden. Die Möglichkeiten lassen sich unterteilen in:

  • Avatare aus Programmbibliotheken – Auswahl aus vorgefertigten Figuren mit unterschiedlichen Stilen.

  • Avatare auf Basis eigener Fotovorlagen – realistisch oder stilisiert (z. B. Cartoon- oder Anime-Look).

  • Digitale Klone – individuelle Avatare von realen Personen, die aus einer kurzen Videoaufnahme (ca. 2–5 Minuten) oder einem Foto erstellt werden.

  • Lip-Sync-Funktion – Übersetzung und Anpassung bestehender Videos, sodass Lippenbewegungen zur neu gewählten Sprache passen.

Tool Tipp

Vor allem die Plattformen Syntesia (entwickelt an der TU München) und HeyGen, die sich auf die Videogenerierung mit Avataren spezialisiert haben, liefern die besten Ergebnisse hinsichtlich Bewegungsdarstellung Körpersprache (Gesten und sonstige menschliche Aktionen). Sie bieten eine große Auswahl an Avataren mit Anpassungs- und Bearbeitungsmöglichkeiten (Stimme, Ausdruck, Emotionen, Gesten) an.

Einige Produktionsfirmen bieten den Service an, bei der Erstellung von digitalen Klonen und damit Repräsentanten zu unterstützen. So werden qualitativ hochwertige Videos erstellt, die als Vorlage für eigenen Avataren in HeyGen genutzt werden können.

Beispiele aus der Praxis

Avatare und digitale Klone sind längst Teil öffentlicher Kommunikation. So stellte der Kulturstaatsminister 2025 den Weimatar vor (den "ersten virtuellen Staatsminister") – einen digitalen Avatar, der mithilfe der Software Synthesia und einer Produktionsfirma entwickelt wurde.

Auch das KI-Nachrichtenformat LaDaDi KOMPAKT nutzt ähnliche Technologien:

   

   

KI-Nachrichtenformat LaDaDi KOMPAKT

Andere Anbieter wie Descript bieten zwar ebenfalls Avatar-Funktionen, jedoch derzeit mit eingeschränkteren Möglichkeiten. Meist werden hier nur Kopf und Lippen animiert, während Gestik und Mimik reduziert bleiben.


Beispielscreen HeyGen


Beispielscreen HeyGen

Chancen und Grenzen

Ob KI-Avatare für eine Videoproduktion geeignet sind, hängt von der Art des Videos und dessen Zielsetzung ab. Nicht in jedem Kontext ist der Einsatz sinnvoll. Personen sollten sorgfältig abwägen, ob sie ihr eigenes Erscheinungsbild für die Erstellung eines digitalen Klons bereitstellen möchten.

Neben datenschutzrechtlichen Aspekten spielen dabei auch Persönlichkeitsrechte  sowie die mögliche Verwendung des Materials für das Training des KI-Modells eine große Rolle. Zudem kann eine übermäßige Nutzung standardisierter Avatare zu einer gewissen Übersättigung führen, wenn dieselben Vorlagen von vielen Nutzenden verwendet werden – abhängig vom jeweiligen Lizenzmodell.

Echte Personen vor der Kamera können hingegen durch ihre Authentizität und emotionale Präsenz eine stärkere persönliche Verbindung schaffen. Dennoch bieten KI-Avatare interessante Möglichkeiten, Inhalte konsistent, mehrsprachig und ressourcenschonend zu vermitteln.

Ein transparenter Umgang mit KI-generierten Inhalten ist grundsätzlich unabdingbar – sowohl aus ethischer als auch aus didaktischer Perspektive.