Wie KI die Videoerstellung vereinfacht
KI hält immer mehr Einzug in den normalen Arbeitsalltag vieler Firmen, auch bei Tourismus NRW. Für die Präsentation der Halbjahreszahlen 2024 der Beherbergungsstatistik hat der Verband erstmals einen KI-Avatar eingesetzt. Einige Schritte im Prozess erledigte die KI dabei schon erstaunlich gut, bei anderen gibt es (noch) Luft nach oben.
„Die Erstellung des Avatars war sehr einfach und schnell gemacht“, berichtet Julia Schumacher, Referentin im Projekt „Tourismus Data Intelligence Initiative NRW“ im Verband. Hierfür sei lediglich eine Videoaufnahme von zwei bis drei Minuten der Kollegin nötig gewesen, die zum Avatar werden sollte. „Leonie konnte dabei über ein beliebiges Thema sprechen. Es ging nur darum, ihre Stimme, ihre Mimik und ihre Gestik einmal aufzunehmen, damit der Avatar sie später imitieren kann“, erläutert Schumacher.
KI-Avatare: Schnelle Erstellung mit Plattformen wie HeyGen
Das Video sei dann auf die Plattform „HeyGen“ hochgeladen worden. Innerhalb von zehn Minuten habe diese den Avatar erstellt. Um Missbrauch zu verhindern, musste Leonie Jasper, die als Avatar-Vorlage diente, zuvor noch einen vorgegebenen Satz in die Webcam sprechen. „Dadurch soll sichergestellt werden, dass die aufgenommene Person auch diejenige ist, die den Avatar erstellen möchte“, erklärt Schumacher.
Die Videoerstellung selbst habe dann funktioniert wie Videoschnittprogramme: Unterschiedliche Elemente wie Avatar, Fotos oder Untertitel können hinzugefügt werden und sind über eine Zeitleiste steuerbar, ebenso wie eine Tonspur. Die einzelnen Abschnitte lassen sich ähnlich bearbeiten wie eine PowerPoint-Präsentation. „Wer will, kann auch eine vollständige PowerPoint-Präsentation hochladen. Die einzelnen Folien werden dann jeweils als Hintergrund verwendet und zu jeder Folie kann ein vorbereiteter Text hinzugefügt werden“, erläutert Schumacher. Wer keinen eigenen Avatar erstellen will, kann vom Programm gestellte Avatare und Stimmen nutzen.
KI und Skripterstellung: Unterstützung durch ChatGPT
Auch bei der Skripterstellung unterstützt das Programm. Möglich macht dies eine Anbindung an ChatGPT. Für das eigene Video habe man jedoch direkt in ChatGPT gearbeitet und den anfänglichen Output noch händisch bearbeitet, sagt Theresa Schauerte, Assistentin im Projekt "Tourismus Data Intelligence Initiative NRW" bei Tourismus NRW. „Zuerst wollten wir auch den Feinschliff am Skript mithilfe von ChatGPT erledigen, aber es hat sich gezeigt, dass das händisch doch effizienter ging“, sagt Schauerte.
Der fertige Text wird in das KI-Videoerstellungsprogramm geladen und von diesem direkt vertont. Anschließend kann der Ton bearbeitet, etwa die Geschwindigkeit der Sprache angepasst oder Pausen an gewünschten Stellen eingefügt werden. Auch die Aussprache lässt sich beeinflussen: „Wir haben zum Beispiel Wörter so geschrieben, wie sie gesprochen werden sollten, also Tschio statt CHIO“, berichtet Schumacher. Zahlen über 100 seien zudem ausgeschrieben worden, da die Software ansonsten Zahlenteile verschluckt habe.
Zeitaufwand und Effizienz bei der Erstellung von KI-Videos
Insgesamt habe die Produktion des Videos rund 20 Stunden gedauert, sagt Leonie Jasper, die das Projekt „Tourismus Data Intelligence Initiative NRW“ bei Tourismus NRW leitet. Darin eingerechnet sind allerdings auch das Kennenlernen des neuen KI-Tools, ebenso wie die PowerPoint- und Skript-Erstellung, eine anfängliche Ideensammlung und die Erstellung eines ersten Beispielvideos. Die reine Videoerstellung inklusive Produktion des Textes und finaler Anpassungen habe letztlich gut sechs Stunden gedauert, sagt Jasper. „Und wenn wir ein ähnliches Videoformat nochmal machen, dürfte der Prozess noch effizienter sein“, glaubt sie.
KI-basierte Videopräsentationen: Vorteile und Zukunftsperspektiven
In der Branche hat der Testballon für Aufmerksamkeit gesorgt. „Viele haben gar nicht bemerkt, dass nicht ich selbst präsentiert habe, sondern mein Avatar“, berichtet Jasper. Weitere Einsätze der Software im Verband werden voraussichtlich folgen. Denn die Einsatzmöglichkeiten der Software sind vielfältig, beispielsweise auch fürs Auslandsmarketing. „Videos in anderen Sprachen zu erstellen, ist auf diese Weise ganz einfach“, sagt Jasper. Wenige Klicks reichen aus, damit der Avatar den Text lippensynchron etwa auf Niederländisch, Englisch oder auch Chinesisch wiedergebe.
„Unsere ersten Erfahrungen zeigen, dass KI in der Videoerstellung schon jetzt einiges leistet”, fasst Jasper zusammen. Und die Entwicklung stehe erst am Anfang.