Überblick

Textbasierter Videoschnitt und textbasierte Bearbeitung nutzen die Transkription der Audiospur, um Videos – etwa Interviews oder Clips mit Statements oder Sprecher*innen – gezielt und effizient zu bearbeiten. KI-Tools unterstützen dabei, geeignete Szenen schnell zu finden und zu schneiden, und ermöglichen einen besonders präzisen und zeitsparenden Workflow.

Grafik

Kompetenzen

  • KI-Tools zur textbasierten Videobearbeitung auswählen und anwenden
  • Vorteile der inhaltsbasierten Methode verstehen und reflektieren
  • Transkriptionen erstellen und gezielt weiterverarbeiten
  • Grundlagen des Videoschnitts kennen und anwenden
  • Grundlagen von Speech-to-Text-Technologien verstehen und bewerten
Interviews effizient schneiden mit KI-Unterstützung

Ein aufgenommenes Interview manuell zu sichten und zu schneiden, kostet viel Zeit. KI-gestützte Tools können diesen Prozess erheblich vereinfachen – auf Grundlage einer automatisch erstellten Transkription der Audiospur.
Viele Videoschnittprogramme erzeugen solche Transkripte direkt im Tool. Sie lassen sich anschließend nicht nur zur Untertitel-Erstellung, sondern auch für den textbasierten Videoschnitt verwenden. Die Analyse der Audioaufnahme erfordert allerdings eine gewisse Hardwareleistung, sodass der Vorgang je nach Performanz einige Zeit dauern kann bis das Transkript vorliegt. Ähnlich verhält es sich bei Online-Plattformen: die Aufträge werden oft priorisiert und in eine Warteschlange gesetzt.

Transkriptionen für den Videoschnitt nutzen

Die Methode des textbasierten Videoschnitts unterscheidet sich deutlich vom klassischen, visuell orientierten Schnitt. Statt die Timeline nach Bildern zu durchsuchen, lässt sich das Material hier über den Inhalt steuern. Bei der textbasierten Videobearbeitung erfolgt der Schnitt auf Grundlage des gesprochenen Inhalts. Das Material lässt sich gezielt nach bestimmten Aussagen durchsuchen, ansteuern und kürzen.
Diese Methode setzt voraus, dass im Video Sprachaufnahmen (z. B. Kommentar, Statement oder Interview) vorhanden sind. Auch wenn im fertigen Video nur wenige Sprachanteile vorkommen, kann die Methode helfen, diese gezielt und effizient zu bearbeiten.

Zu Beginn analysiert die KI die Audiospur und wandelt Sprache mithilfe eines Speech-to-Text-Modells (z. B. Whisper von OpenAI) in Text um. Dabei entstehen Textblöcke mit Timecodes, die als Sprungmarken im Schnitt genutzt werden können – ähnlich wie in einem Texteditor.

Vorteile und Stolperfallen

Ein wesentlicher Vorteil der Methode des textbasierten Videoschnitt ist die Möglichkeit, Füllwörter, Versprecher oder störende Laute automatisch entfernen zu lassen. So wirkt das Video professioneller und fokussierter. Allerdings ist eine manuelle Kontrolle unerlässlich:

Stolperfalle

Es kommt immer wieder vor, dass Inhalte halluziniert werden oder dass das Transkript Fehler enthält. Daher muss das Transkript vor einer Übersetzung bzw. im Zuge der Fertigstellung des Videos immer überprüft werden.

Auch Fachbegriffe, Eigennamen oder inhaltlich heikle Stellen sollten immer überprüft werden. Wenn störende Tonabschnitte entfernt wurden, muss sichergestellt sein, dass diese auch im Videomaterial gelöscht wurden.


Textbasiertes Schneiden in der Praxis

Im folgenden Beispiel wird die Methode anhand von Adobe Premiere demonstriert. Dabei werden zwei Videoclips transkribiert, überprüft und bearbeitet. Anschließend werden die gewünschten Textpassagen kombiniert, geschnitten und gekürzt.

Ähnlich funktioniert der Umgang mit Transkripten in DaVinci Resolve, Camtasia (mit Audiate) und Filmora (Wondershare).

 

 

TODO Beschreibung Video

Bei Adobe Premiere kann bereits beim Import eine automatische Medienanalyse (Media Intelligence) aktiviert werden. Dadurch wird zu Beginn ein Transkript erzeugt, das sofort genutzt werden kann.

Ein weiterer Vorteil: Das Material lässt sich nach visuellen Merkmalen, Textinhalten oder Metadaten durchsuchen. So kann im Bearbeitungsmodus beispielsweise gezielt nach einem bestimmten Interviewausschnitt gesucht werden. Anhand von visuellen Merkmalen, Aussagen im Text oder Metadaten wird der jeweilige Ausschnitt gesucht und gefunden. Aktuell funktioniert die Suche nach visuellen Merkmalen aufgrund der Trainingsdaten des zugrunde liegenden KI-Modells aktuell nur auf Englisch.

Beispiel: Neue Adobe Premiere Media Intelligence Funktion

Tool-Überblick und Einsatzbereiche

Tool Tipp

Während Adobe Premiere und DaVinci Resolve vor allem im professionellen Bereich eingesetzt werden, findet Camtasia häufig in der E-Learning-Produktion im Lehr-Lern-Kontext Verwendung. Filmora hingegen eignet sich besonders für die Erstellung von Social-Media-Inhalten und zeichnet sich, ebenso wie CapCut, durch eine einfache und intuitive Bedienung aus. Da CapCut von den TikTok-Entwicklern stammt und in Bezug auf Datenschutz kritisch zu bewerten ist, wird dieses Tool hier nicht näher behandelt.

Neben diesen Tools gibt es eine Reihe weiterer Plattformen mit integriertem Online-Videoeditor, die ebenfalls textbasiertes Schneiden ermöglichen. Dazu gehören beispielsweise Canva, Runway, Synthesia, Heygen oder der Videoeditor von Vimeo.

Wenn du andere Tools oder Plattformen mit integriertem Online-Editor nutzt, prüfe, ob eine textbasierte Bearbeitungsfunktion und ein Speech-to-Text-Modul integriert sind – wie beispielsweise bei Descript (auch als Desktop-App für größere Projekte nutzbar) oder InVideo.ai. Beide Tools funktionieren aktuell nur auf Englisch zuverlässig und eignen sich eher für Kurzvideos.

Beispiel: InVideo.ai - Textbasierte Bearbeitung in Form eines Chats

Beispiel: Descript Video-Editor mit einer generierten Avatar und passendem Skript

Ein besonderer Vorteil dieser Plattformen ist die Möglichkeit, Videos mithilfe eines integrierten Sprachmodells in Form eines Chatbots zu erstellen und zu bearbeiten. Durch die Eingabe von Prompts kann zunächst automatisch ein Video generiert und anschließend weiter bearbeitet werden kann. Die KI analysiert dabei das eingegebene Material und kombiniert Inhalte aus der integrierten Stockbibliothek oder erzeugt neues Material.

Sollten einzelne Aufnahmen nicht zu deiner Vorstellung passen, können sie unkompliziert ersetzt werden – bei InVideo.ai z. B. durch direkten Austausch, Upload oder eine neue Eingabe per Prompt. Allerdings kann die Darstellung und Bearbeitung je nach Projektumfang etwas unübersichtlich werden.


Export und Weiterverarbeitung

In Tools wie Descript lassen sich das bearbeitete Material und die Videos exportieren, um sie anschließend in anderen Programmen (z. B. Adobe Premiere) weiterzubearbeiten oder an andere Personen zu übergeben. Dabei können jedoch Einschränkungen bestehen (siehe: Descript Hilfeartikel).