KI hilft beim Nachsynchronisieren von Kinofilm "The Champion"

// 15:15 Sa, 16. Apr 2022von Thomas Richter

Filme in Fremdsprachen haben immer einen großen Nachteil gegenüber Filmen, welche in der jeweils lokalen Sprache gedreht wurden, denn entweder müssen sie untertitelt werden, was von vielen Zuschauern als ablenkend von der Handlung empfunden wird, oder aufwändig gedubbt werden, d.h. die Originalstimmen werden durch Sprecher ersetzt, welche die Originaldialoge in der jeweiligen Landessprache - möglichst Lippensynchron übersetzt - nachsprechen. Mit dem Vorteil, daß es keinen ablenkenden Text parallel zu lesen gibt, der allerdings mit dem Nachteil erkauft wird, daß es sich nicht mehr um die Originalstimme des/der Schauspielers/in handelt und der neue Sprechertext nicht lippensynchron wiedergegeben werden kann. Zudem ist das Ganze recht teuer, d.h. es lohnt sich nur bei größeren Filmen/Märkten, wenn mit einem ausreichend großen Erfolg gerechnet wird, um die Ausgaben für das Dubbing wieder einzuspielen.

KI hilft beim Nachsynchronisieren von Kinofilm "The Champion"

Neue Entwicklungen im Bereich DeepLearning versprechen hier eine Lösung - so kann passend zur Stimme der Synchronsprecher die Mimik und Lippenbewegungen der Schauspieler angepasst werden. Das Startup Flawless AI bietet eine solche automatische nachträgliche Anpassung der Mundbewegungen per KI passend zum Dubbing schon seit einem Jahr an.

Der Trailer enthält leider keine der nachsynchronisierten englischen Szenen, diese finden sich nur im Artikel von FXGuide

Der polnische Film "The Champion of Auschwitz" (2021) von Regisseur Maciej Barczewski ist nun der erste Kinofilm, der mit einer ähnlichen Methode synchronisiert wurde. Hier wird allerdings nicht vollkommen auf eine DeepLearning-Lösung gesetzt, welche die typischen Mundbewegungen der Schauspieler aus Filmmaterial erst lernt und dann synthetisiert (wie bei Flawless AI). Statt dessen müssen die Schauspieler selbst den Synchrontext neu einsprechen und werden dabei gefilmt. Mittels eines dank der Daten dieser Performance ermittelten digitalen Modells des Gesichts kann der Algorithmus dann die Bilder im fertigen Film ändern, um die Gesichts- und Lippenbewegungen des Schauspielers dem neuen Synchrontext anzupassen.

Digitales Gesichtsmodell zum anpassen der Gesichtszüge

Die "Platon Prozess" getaufte Technik wurde von Pinscreen Technology entwickelt, der Firma eines weltführenden Experten für Neural Rendering Dr. Hao Li (übrigens ein deutscher Forscher mit taiwanesischen Wurzeln), zusammen mit der israelischen Firma Adapt Entertainment, welche die Rechte für die weltweiten englischsprachigen Vermarktung des Film erworben hatte.

Der "Platon Prozess" besteht aus einer Reihe verwobener Algorithmen und beruht auf maschinellem Lernen und neuronalem Rendering. Als Trainingsdaten für die Gesichtsneuanimation reichen die Bilder des fertigen Films. Das Einsprechen der neuen Texte erfolgt in einem neutralen Setting und wird von mehreren normalen Kameras aufgenommen, es werden keine speziellen Lichter oder Gesichtsmarker benötigt.

Die nachträgliche Änderung der Gesichtsbewegungen im fertigen Film funktioniert bei allen Arten dramatischer Beleuchtung, unterschiedlichen Kopf- und Kamerawinkeln und auch wenn der Schauspieler Spezialeffekt-Makeup trägt. Ein weiterer Vorteil ist, daß der Prozess der Lippensynchronisation auch mit großen Massen an Material funktioniert und keine aufwändige manuelle Nachbearbeitung benötigt. Im verlinkten Artikel von FXGuide finden sich einige Beispiel-Clips.

Capturingaufnahmen im Studio für Synchronisation

Wir sehen diese Technologie als einen ersten Schritt an; die weiteren Entwicklungsstufen sind schon vorgezeichnet, da die dafür notwendigen Methoden schon existieren und nur noch so weit in ihrer Qualität verbessert werden müssen, daß ihre Ergebnisse auch auf einer großen Leinwand bestehen können.

So besteht beim "Platon Prozess" noch - im Gegensatz zu anderen Methoden - die Notwendigkeit, daß die Schauspieler selbst ihren Synchrontext für in andere Sprachen einsprechen müssen und dabei gefilmt werden. Das ist nicht nur aufwändig, sondern auch unschön, da die meisten Schauspieler eher selten mehrere andere Sprachen akzentfrei beherrschen.

Eine Alternative dazu bietet zum Beispiel DeepDub, ein ebenfalls auf DeepLearning beruhender Startup, der den Dubbingprozess stark vereinfacht. Hier reichen nur zwei bis drei Minuten Material einer Stimme, um ein Sprechmodell zu erstellen, welches die Eigenschaften der Originalstimmen in eine andere Sprache überträgt und so auch synthetisieren kann. So können Filme mit den Stimmen der ursprünglichen Schauspieler in einer anderen Sprache gedubbt werden. Hier allerdings fehlt die nachträgliche Anpassung der Mundbewegungen, um die Performance vollkommen stimmig zu machen.

Klar ist, daß die entsprechenden Technologien für das Dubbing von Filmen sich schnell entwickeln. Dadurch vereinfachen, verbilligen und beschleunigen sie die Möglichkeit, Filme auch in anderen Ländern und damit in einem noch größeren Markt anzubieten, was eine große Chance für Filmemacher darstellt. Gerade auch weil Filme mit Untertiteln bei vielen Zuschauern nicht sehr gerne gesehen werden und ein Dubbing, besonders wenn es in der Originalstimme erfolgt, den Film besser erfahren läßt.

Bei fortschreitendem Einsatz solcher Technologien wird allerdings auch ein Problem entstehen: Synchronsprecher bzw. Schauspieler, die vielfach auch vom Dubbing von Filmen leben, könnten immer mehr Jobs durch solche Algorithmen verlieren. In Zukunft könnte der ganze Prozess per KI für viele Videos auch ganz automatisiert werden (zum Beispiel von YouTube), angefangen von der automatischen Erkennung von Sprache, über die Übersetzung, der Synthetisierung der Stimmen in einer neuen Sprache samt Anpassung der Lippenbewegung, um das ganze natürlicher aussehen zu lassen. (Danke an Frank Glencairn).

mehr Infos bei
www.fxguide.com

Auf Socials teilen:

Leserkommentare // Neueste

tom // 10:58 am 17.4.2022

Leider gibt es keine der englisch nachsynchronisierten Szenen auf YouTube, die finden sich nur im verlinkten Artikel von FXGuide. Der Trailer ist nur für den Kontext...weiterlesen

Alex // 15:49 am 16.4.2022

Ich verstehe den im Artikel verlinkten Trailer von "The Champion Of Auschwitz" im Kontext nicht. Was soll dieser zeigen? Einstellungen von (lippensynchron) sprechenden Leuten gibt...weiterlesen

Im Forum mitdiskutieren >>

Ähnliche News //

News

Neu gewählt: Die 100 besten Filme der Welt - mit neuer Überraschungs-Nummer 1

Es gibt viele Listen von besten Filmen, aber einen besonderen Stellenwert hat die nur alle 10 Jahre ermittelte Liste der 100 besten Filme aller Zeiten der englischen ...

// 18:24 Sa, 3. Dez 2022von Thomas Richter

News

DeepFake statt Nachdreh: Schimpfwörter nachträglich aus Kinofilm entfernt

Die enormen Möglichkeiten von DeepFake-Technologie, um mit geringem Aufwand schon gefilmte Szenen nachträglich zu ändern, zeigen sich aktuell am Fall des Action Thrillers "Fall" .....

// 14:51 Fr, 19. Aug 2022von Thomas Richter

News

Dokumentarfilm-Festival Longshots: Filme kostenlos anschauen und abstimmen

Die BBC veranstaltet zum zweiten Mal das Online Dokumentarfilm-Festival Longshots und kooperiert dafür mit 13 renommierten Filmfestivals aus der ganzen Welt - jedes Festival ...

// 18:16 Do, 26. Aug 2021von Thomas Richter

News

Oscars 2023: Mit welchen Kameras wurden die nominierten Filme gedreht?

Gerade hat die Academy of Motion Picture Arts and Sciences die Nominierungen für den Oscar 2023 bekanntgegeben. Zeit also, sich die ausgewählten Filme für den prestigeträchtigsten ...

// 10:25 So, 29. Jan 2023von Thomas Richter

News

Visuelles Dubbing per KI macht jeden Schauspieler zum Mehrfach-Muttersprachler

Viele Zuschauer stören sich bei fremdsprachigen Filmen, die nachträglich synchronisiert (gedubbed) sind, an den nicht zu den gehörten Lauten passenden Lippenbewegungen. Wir hatten ...

// 09:20 Di, 25. Mai 2021von Thomas Richter

zur Newsübersicht >

Generative Video-KI-Funktionen Adobe Firefly für Premiere Pro - Generative Extend, Object removal/addition

Zuletzt im Oktober hatte Adobe Firefly-Funktionen für Premiere Pro geteasert, darunter eine Generative Fill-Funktion - nun wird es konkret. Denn noch in diesem Jahr sollen über ...

// 15:08 Mo, 15. Apr 2024von blip

News

Übernahme ist durch RED ist nun eine Nikon-Tochter - und Jarred Land abgesetzt

Rechtzeitig zur NAB gab Nikon bekannt, die Übernahme von RED sei nun zu 100% vollzogen. Ab sofort werden Jarred Land zusammen mit James Jannard nur noch enge Berater der Nikon-...

// 14:13 So, 14. Apr 2024von blip

News

Günstiger und besser? Blackmagic stellt neues DaVinci Resolve Micro Color Panel für 495 Dollar vor

Blackmagic Design hat auf der NAB mit dem DaVinci Resolve Micro Color Panel ein weiteres, besonders erschwingliches Pult für die Farbkorrektur mit DaVinci Resolve angekündigt, ...

// 09:06 Sa, 13. Apr 2024von Rudi Schmidts

News

Blackmagic PYXIS 6K: Die Vollformat "Box"-Kamera mit Viewfinder, 2x SDI, Sideplates (!) uvm.

Am vielseitigsten riggbare Cam Blackmagic PYXIS 6K: Die Vollformat „Box“-Kamera mit Viewfinder, 2x SDI, Sideplates ...

Von vielen seit langem ersehnt und jetzt da: Blackmagic stellt mit der Pyxis 6K gleich drei leistungsstärkere Vollformat-Versionen seiner Cinema Camera 6K vor, die in ein ...

// 03:40 Sa, 13. Apr 2024von Rob

TOP THEMEN //

zum Forum >>

MEHR NEWS

zum Newsindex >

PASSENDE DISKUSSIONEN

zum Forum >>

Passende Artikel //

Test

Drei Nikon Z 9 Lesertests aus der professionellen Praxis + Bekanntgabe des Z 9 Gewinners

Drei slashCAM-Leser aus dem Pro-Umfeld testeten die Flaggschiff Nikon Z 9. Um die teils sehr aufwendigen und auf hohem Niveau gesammelten Praxis-Erfahrungen möglichst ungefiltert ...

// 14:46 Fr, 3. Mär 2023von slashCAM

Adobe Premiere Pro - Filler Word Detection und Enhance Speech erklärt

Text-Based Editing wird mit neuen Tools ausgebaut - mit einem einfachen Klick lassen sich nun Füllwörter (etwa die berüchtigten "Ähs") im Text automatisch finden und löschen, ...

// 11:59 Di, 26. Sep 2023von slashCAM

zur Artikelübersicht >

Was hältst du von den neuen Bild/Video-KIs?
Toll, so viele neue Kreativtools!
Sie werden das Filmemachen vereinfachen
Sie werden das Filmen z.T. ersetzen
Sie werden mich arbeitslos machen
Die sind völlig überbewertet

Ergebnis ansehen

Aktuelle News //

News

High-End Cinema Kamera Blackmagic URSA Cine 12K erklärt: Dynamikumfang, Monitoring-Setup uvm...

Keine andere Kamera von Blackmagic Design ist bislang in der Lage gewesen, 16 Blendenstufen an Dynamikumfang darzustellen. Hinzu kommen neue Assist-Monitoring Funktionen, hohe ...

// 11:37 Fr, 19. Apr 2024von Rob

News

SD und CFexpress Angelbird MagSafe externe Recording Modules - nicht nur für iPhones

Der österreichische Zubehörspezialist Angelbird hat auf der NAB zwei sehr interessante, externe "Recording Modules" für iPhones präsentiert, die weitaus universeller einsetzbar ...

// 11:21 Fr, 19. Apr 2024von Rudi Schmidts

zur Newsübersicht >