Synthetische KI-Stimmen machen professionellen Sprechern Konkurrenz

// 13:26 So, 21. Mai 2023von blip

Generative KIs können mittlerweile Texte erstellen, die wie aus Menschenhand klingen, fotorealistische Bilder aus dem Nichts zaubern und nichtzuletzt - wie schon öfters an dieser Stelle Thema war - menschliche Stimmen glaubhaft synthetisieren. Sowohl Stimmen, die es real gibt, als auch künstliche Neue lassen sich generieren, oder besser gesagt, es lassen sich Aufnahmen mit solchen Stimmen erstellen.

Anders als etwa die Roboterstimmen, die schon vor Jahren versuchten, uns dubiose Dienste per Telefon zu verkaufen, klingen die jetzt sprechenden Algorithmen uns Menschen tatsächlich zum verwechseln ähnlich. Nicht nur die Aussprache ist quasi perfekt, sie können sogar Emotionen simulieren. Dies wird bereits in betrügerischer Absicht genutzt (etwa bei Enkeltricks oder Erpresseranrufen), doch naheliegend sind natürlich auch viele andere Einsatzzwecke - nämlich praktisch überall, wo bisher Soundaufnahmen von SprecherInnen verwendet wurden. Wir würden tippen, dass wir KI-Stimmen schon häufiger begegnen, als wir denken.

Einem aktuellen Bericht nach beschweren sich beispielseweise Hörbuchsprecher über stark schwindende Aufträge - die Einnahmen sollen sich in manchen Fällen halbiert haben im Vergleich zum Vorjahr. Schuld daran soll hauptsächlich die Konkurrenz durch KI-basierte Vertonungen sein. Es gibt mehrere Dienste im Internet, die anbieten, Hörbücher zum Bruchteil des üblichen Preises zu erstellen. "Gesprochen" werden diese von künstlichen Stimmen mit einem antrainierten Gefühlsregister. In manchen Fällen wurden tatsächliche Sprecherstimmen geklont und ihre Urheber erhalten Lizenzgebühren, wenn ihre Stimme für Aufträge genutzt wird, doch ist dies nicht immer so.

Während traditionelle Sprecher durch KI ihre Lebensgrundlage zu verlieren drohen, werden die neuen Dienste als Demokratisierung der Hörbuchbranche angepriesen. Auch die kleinsten Verlage könnten sich nun Hörbuchversionen leisten, lautet das Argument. Bei deren weitgehend automatisierter Erstellung werden veraussichtlich allerdings nur noch eine handvoll Dienste mitverdienen. Mit einer Kennzeichnungspflicht für KI-basierte Hörbuchproduktionen, wie es manche Sprecher fordern, könnte das Publikum immerhin noch selbst entscheiden, von wem sie sich Geschichten vorlesen lassen.

Ähnlich dürfte es im Synchronisierungsbusiness aussehen. Vorreiter hier scheint Lateinamerika zu sein, zumindest machte im Februar ein Artikel die Runde, der beschreibt, wie dortige Sprecher zunehmend unter Druck geraten durch automatische Dubbing-Dienste, die eben diese Sprecher Stimmsamples für ihr KI-Stimmtraining haben einlesen lassen - zu Dumpingpreisen und ohne weitere Beteiligung.

All diese automatisch generierten KI-Stimmen mögen menschlich klingen und ihre Betonung an den gesprochenen Inhalt anpassen können. Das heißt natürlich nicht, dass sie mit echten (Stimm-)Schauspielern mithalten können. Eine gute Synchronfassung etwa wurde klassischerweise von geschulten Sprechern mit einer richtigen Regie eingesprochen und konnte in manchen Fällen qualitativ mindestens so gut sein, wie das Original (manchmal sogar besser - zumindest lustiger, wie im legendären Fall von Die Zwei).

Heutige Synchronfassungen wirken (im Fernsehen zumal) oft deutlich liebloser, werden in der Regel auch sehr viel billiger und schneller produziert. Es mag in manchen Fällen vielleicht gar keinen so großen Unterschied mehr machen, wenn auf synthetische Stimmen gesetzt wird. Auch lassen sich durch KI ja bekanntlich sogar die Lippenbewegungen im Bild auf den neuen, gesprochenen Text anpassen, sodass es wohl bald möglich wäre, beispielseweise Ryan Gosling als K in Blade Runner seinen Text auf Deutsch abliefern zu lassen, in seiner "eigenen" Stimme.

Gar nicht so uncool, falls dies wirklich gut gelingen sollte. Doch die Aussicht auf einen billigen, KI-generierten Synchro-Gefühlseinheitsbrei allerorten ist weniger erfreulich.

mehr Infos bei
www.blackmagicdesign.com

Auf Socials teilen:

Leserkommentare // Neueste

blindcat // 18:13 am 23.5.2023

Sag Bescheid wenn Dir was unterkommt ... :-)

Frank Glencairn // 17:55 am 23.5.2023

Ich weiß, hab ich alles schon durch (und wieder gelöscht), war spannend und unterhaltsam, hab allerdings für beides (außer Spieltrieb) keine wirkliche Anwendung - was ich...weiterlesen

blindcat // 17:07 am 23.5.2023

Was die Sprecher angeht, wäre es eine gute Idee wenn die Agenturen tätig werden und Modelle ihrer Sprecher erstellen, die schützen lassen und sie dann alternativ zur...weiterlesen

Im Forum mitdiskutieren >>

Ähnliche News //

News

Künstler vs KIs: Neues Tool macht Kunstwerke für KIs unverdaulich

Der Boom bildgenerierender KIs, die per Prompt beliebige Bilder erzeugen, hat bei Künstlern große Ängste ausgelöst, kann doch jeder Kunst- oder Künstlerstil - egal ob Malerei, ...

// 19:51 Mo, 20. Feb 2023von Thomas Richter

News

Bild-KI Midjourney V5 liefert fotorealistische Bilder - und endlich auch korrekte ...

Midjourney, eine der drei großen bildgenerierenden KIs, hat mit der eben erschienenen neuen (Alpha)Version 5 einen weiteren großen Schritt gemacht: die produzierten Bilder weisen ....

// 12:24 So, 19. Mär 2023von Thomas Richter

News

Adobe führt Credit-basiertes Modell für generative KI ein (und die Creative Cloud ...

Zur IBC präsentierte Adobe aktuelle Beta-Versionen von Premiere Pro und After Effects mit interessanten Neuigkeiten, wie bereits beschrieben. Zeitgleich wurden auch die neuen ...

// 18:59 Mo, 18. Sep 2023von blip

News

Stockphoto-Portal Shutterstock integriert KI-Bilder und gibt eine Antwort auf die ...

Seit kurzem steht die Frage im Raum, wie Künstler und Stock-Fotodienste überleben können, wenn bildgenerierende KIs wie DALL-E 2, Stable Diffusion oder Midjourney beliebige Bilder ...

// 09:41 Sa, 5. Nov 2022von Thomas Richter

News

KIs imitieren Stimmen perfekt - Vorsicht vor anrollenden Betrugswellen

Befürchtet war es ja schon länger - jetzt ist es so weit: Die ersten Telefontrickbetrüger nutzen Stimmen-KIs, um alte Menschen durch einen vorgeblichen Notfall eines ihrer Kinder ....

// 13:16 Do, 9. Mär 2023von Thomas Richter

zur Newsübersicht >

Generative Video-KI-Funktionen Adobe Firefly für Premiere Pro - Generative Extend, Object removal/addition

Zuletzt im Oktober hatte Adobe Firefly-Funktionen für Premiere Pro geteasert, darunter eine Generative Fill-Funktion - nun wird es konkret. Denn noch in diesem Jahr sollen über ...

// 15:08 Mo, 15. Apr 2024von blip

News

Übernahme ist durch RED ist nun eine Nikon-Tochter - und Jarred Land abgesetzt

Rechtzeitig zur NAB gab Nikon bekannt, die Übernahme von RED sei nun zu 100% vollzogen. Ab sofort werden Jarred Land zusammen mit James Jannard nur noch enge Berater der Nikon-...

// 14:13 So, 14. Apr 2024von blip

News

Günstiger und besser? Blackmagic stellt neues DaVinci Resolve Micro Color Panel für 495 Dollar vor

Blackmagic Design hat auf der NAB mit dem DaVinci Resolve Micro Color Panel ein weiteres, besonders erschwingliches Pult für die Farbkorrektur mit DaVinci Resolve angekündigt, ...

// 09:06 Sa, 13. Apr 2024von Rudi Schmidts

News

Blackmagic PYXIS 6K: Die Vollformat "Box"-Kamera mit Viewfinder, 2x SDI, Sideplates (!) uvm.

Am vielseitigsten riggbare Cam Blackmagic PYXIS 6K: Die Vollformat „Box“-Kamera mit Viewfinder, 2x SDI, Sideplates ...

Von vielen seit langem ersehnt und jetzt da: Blackmagic stellt mit der Pyxis 6K gleich drei leistungsstärkere Vollformat-Versionen seiner Cinema Camera 6K vor, die in ein ...

// 03:40 Sa, 13. Apr 2024von Rob

TOP THEMEN //

zum Forum >>

MEHR NEWS

zum Newsindex >

PASSENDE DISKUSSIONEN

zum Forum >>

Passende Artikel //

Aktuelles

Stoppt Mickey Mouse die KI Kunst Revolution? Künstler protestieren gegen KI Konkurrenz

Die neuen bildgenerierenden KIs stellen eine Revolution dar: sie eröffnen erstmals die Möglichkeit, massenhaft hochqualitative Bilder nach Wunsch zu erzeugen - in beliebiger Menge,...

// 14:21 Di, 3. Jan 2023von Thomas Richter

Aktuelles

Text-zu-Sprache per KI: Ersetzen synthetische Stimmen bald professionelle Sprecher?

Nach Bild- und Text-generierenden KIs gibt es noch weiteres Feld, in welchem gerade per künstlicher Intelligenz enorme Fortschritte gemacht werden und zwar bei der Synthese von ...

// 19:47 Mo, 6. Feb 2023von Thomas Richter

zur Artikelübersicht >

Was hältst du von den neuen Bild/Video-KIs?
Toll, so viele neue Kreativtools!
Sie werden das Filmemachen vereinfachen
Sie werden das Filmen z.T. ersetzen
Sie werden mich arbeitslos machen
Die sind völlig überbewertet

Ergebnis ansehen

Aktuelle News //

News

Update: Postproduktions-Suite DaVinci Resolve 19: Die neuen Funktionen ausführlich erklärt

Am Blackmagic-Stand auf der NAB 2024 gibt uns Simon von Blackmagic Design einen detaillierten Einblick in die neuen Funktionen von DaVinci Resolve 19. Wir schauen uns ColorSlice, ....

// 15:38 Di, 23. Apr 2024von Rob

News

Besser als Midjourney? Realistischer und mehr Details - Adobe Firefly Image 3 Model für Web und Photoshop

Adobe hat heute auf der MAX London das Adobe Firefly Image 3 Foundation Model vorgestellt, das ab heute als Beta-Version in Photoshop und der Firefly-Webanwendung verfügbar ist. .....

// 14:46 Di, 23. Apr 2024von Rudi Schmidts

zur Newsübersicht >