Deep ja, Fake nein? Dokumentarfilmer läßt O-Töne von KI einsprechen

// 12:02 So, 18. Jul 2021von

Die Frage. wo beim Dokumentarfilm die Authentizität aufhört und das reine Storytelling anfängt, sorgt immer wieder mal für Diskussionen, und das nicht erst, seit es möglich ist, Bilder und Töne digital zu manipulieren. Allerdings wird mit zunehmend besseren Manipulationsmöglichkeiten die Diskussion immer dringlicher, welche dieser Mittel beim dokumentarischen Erzählen unbedenklich sind oder wann eine Grenze überschritten wird.


Einen aktuellen Anlass dafür gibt der Dokumentarfilm Roadrunner: A Film About Anthony Bourdain, der gerade in den US-Kinos angelaufen ist und später auf HBO Max zu sehen sein soll. Darin portraitiert Regisseur Morgan Neville den bekannten Koch und Autor, der ua. kulinarische Reisen für das TV unternahm, bis er sich in 2018 das Leben nahm. Neville tut dies mithilfe von allerlei Film- und Ton-Mitschnitten aus TV, Radio, Podcasts und Audiobüchern uä. sowie selbst geführten Interviews - soweit, so klassisch. Oft ist Bourdains typische Stimme aus dem Off zu hören, das ist nicht ungewöhnlich, so strickt man schließlich eine Erzählung beim Schnitt, wobei er zum Teil als Erzähler seiner eigenen Geschichte auftritt.


Deep ja, Fake nein? Dokumentarfilmer läßt O-Töne von KI einsprechen

Allerdings stellt sich heraus, dass es nicht immer O-Töne sind, die von Bourdain selbst gesprochen wurden, sondern darunter sind auch drei "Audio-Deepfakes", die nachträglich extra für den Film erstellt wurden von einer KI, nachdem sie mit über 10 Stunden Audiomaterial trainiert wurde, um Bourdains Stimme täuschend echt nachmachen zu können. Aufgefallen ist dies ua. einer Reporterin vom New Yorker, die sich darüber wunderte, dass Bourdain eine selbst verfasste E-Mail vorliest, doch auch in diesem Interview spricht der Regisseur offen darüber.



Neville betont, er habe Bourdain keine Worte in den Mund gelegt, die dieser nicht selbst geschrieben habe, aus dramaturgischen Gründen habe er sich jedoch bei einigen Zitaten gewünscht, diese als "O-Ton" verwenden zu können. Außerdem habe er von Bourdains Witwe sowie seinem Nachlassverwalter grünes Licht bekommen.



Alles also halb so schlimm, in diesem Fall, mag man meinen. Und doch beschleicht einen das Gefühl, der Dokumentarfilm hat hier -- wieder einmal? -- seine Unschuld verloren. Denn schließlich wurden O-Töne konstruiert, die als solche nicht existierten, außerdem fügt eine Stimme einer Aussage automatisch Emotionen hinzu, von denen man nicht weiß, ob sie in der geschriebenen Passage genauso enthalten waren. Tatsächlich sagt Neville, es sei gar nicht so leicht gewesen, sich für eine Stimmlage zu entscheiden, denn diese hätte sich bei Bourdain über die Jahre auch verändert.



Nicht zuletzt dehnt jede Regelübertretung den Bereich des Möglichen - wenn es OK ist, eine AI geschriebene Sätze eines Protagonisten nachsprechen zu lassen, ist es vielleicht nicht mehr so abwegig, dabei auch mal den Satzbau ein bißchen zu optimieren, oder vielleicht zwei Sätze zu einem zusammenzufassen, wie man es gerade für sein Timing braucht. Vielleicht läßt sich die Fake-Voice auch bald mit einem künstlich errechneten Bild verknüpfen, inklusive nachempfundener Mimik.



Der Wahrheitsgehalt eines Dokumentarfilms hing immer schon in hohem Maße von der Integrität der Person ab, die ihn erschafft. Doch die technischen Verlockungen nehmen zweifelsohne zu.







Ähnliche News //
Umfrage
  • Was hältst du von den neuen Bild/Video-KIs?





    Ergebnis ansehen
slashCAM nutzt Cookies zur Optimierung des Angebots, auch Cookies Dritter. Die Speicherung von Cookies kann in den Browsereinstellungen unterbunden werden. Mehr Informationen erhalten Sie in unserer Datenschutzerklärung. Mehr Infos Verstanden!
RSS Suche YouTube Facebook Twitter slashCAM-Slash