News: Synthetische KI-Stimmen machen professionellen Sprechern Konkurrenz

21.5.2023 - 13:26 Uhr

Generative KIs können mittlerweile Texte erstellen, die wie aus Menschenhand klingen, fotorealistische Bilder aus dem Nichts zaubern und nichtzuletzt - wie schon öfters an dieser Stelle Thema war - menschliche Stimmen glaubhaft synthetisieren. Sowohl Stimmen, die es real gibt, als auch künstliche Neue lassen sich generieren, oder besser gesagt, es lassen sich Aufnahmen mit solchen Stimmen erstellen.

!

Anders als etwa die Roboterstimmen, die schon vor Jahren versuchten, uns dubiose Dienste per Telefon zu verkaufen, klingen die jetzt sprechenden Algorithmen uns Menschen tatsächlich zum verwechseln ähnlich. Nicht nur die Aussprache ist quasi perfekt, sie können sogar Emotionen simulieren. Dies wird bereits in betrügerischer Absicht genutzt (etwa bei Enkeltricks oder Erpresseranrufen), doch naheliegend sind natürlich auch viele andere Einsatzzwecke - nämlich praktisch überall, wo bisher Soundaufnahmen von SprecherInnen verwendet wurden. Wir würden tippen, dass wir KI-Stimmen schon häufiger begegnen, als wir denken.

Einem aktuellen Bericht nach beschweren sich beispielseweise Hörbuchsprecher über stark schwindende Aufträge - die Einnahmen sollen sich in manchen Fällen halbiert haben im Vergleich zum Vorjahr. Schuld daran soll hauptsächlich die Konkurrenz durch KI-basierte Vertonungen sein. Es gibt mehrere Dienste im Internet, die anbieten, Hörbücher zum Bruchteil des üblichen Preises zu erstellen. "Gesprochen" werden diese von künstlichen Stimmen mit einem antrainierten Gefühlsregister. In manchen Fällen wurden tatsächliche Sprecherstimmen geklont und ihre Urheber erhalten Lizenzgebühren, wenn ihre Stimme für Aufträge genutzt wird, doch ist dies nicht immer so.

Während traditionelle Sprecher durch KI ihre Lebensgrundlage zu verlieren drohen, werden die neuen Dienste als Demokratisierung der Hörbuchbranche angepriesen. Auch die kleinsten Verlage könnten sich nun Hörbuchversionen leisten, lautet das Argument. Bei deren weitgehend automatisierter Erstellung werden veraussichtlich allerdings nur noch eine handvoll Dienste mitverdienen. Mit einer Kennzeichnungspflicht für KI-basierte Hörbuchproduktionen, wie es manche Sprecher fordern, könnte das Publikum immerhin noch selbst entscheiden, von wem sie sich Geschichten vorlesen lassen.

Ähnlich dürfte es im Synchronisierungsbusiness aussehen. Vorreiter hier scheint Lateinamerika zu sein, zumindest machte im Februar ein Artikel die Runde, der beschreibt, wie dortige Sprecher zunehmend unter Druck geraten durch automatische Dubbing-Dienste, die eben diese Sprecher Stimmsamples für ihr KI-Stimmtraining haben einlesen lassen - zu Dumpingpreisen und ohne weitere Beteiligung.

All diese automatisch generierten KI-Stimmen mögen menschlich klingen und ihre Betonung an den gesprochenen Inhalt anpassen können. Das heißt natürlich nicht, dass sie mit echten (Stimm-)Schauspielern mithalten können. Eine gute Synchronfassung etwa wurde klassischerweise von geschulten Sprechern mit einer richtigen Regie eingesprochen und konnte in manchen Fällen qualitativ mindestens so gut sein, wie das Original (manchmal sogar besser - zumindest lustiger, wie im legendären Fall von Die Zwei).

Heutige Synchronfassungen wirken (im Fernsehen zumal) oft deutlich liebloser, werden in der Regel auch sehr viel billiger und schneller produziert. Es mag in manchen Fällen vielleicht gar keinen so großen Unterschied mehr machen, wenn auf synthetische Stimmen gesetzt wird. Auch lassen sich durch KI ja bekanntlich sogar die Lippenbewegungen im Bild auf den neuen, gesprochenen Text anpassen, sodass es wohl bald möglich wäre, beispielseweise Ryan Gosling als K in Blade Runner seinen Text auf Deutsch abliefern zu lassen, in seiner "eigenen" Stimme.

Gar nicht so uncool, falls dies wirklich gut gelingen sollte. Doch die Aussicht auf einen billigen, KI-generierten Synchro-Gefühlseinheitsbrei allerorten ist weniger erfreulich.

(blip)



Kommentare lesen/schreiben

zur Newsmeldung auf slashCAM

   


die Seite in Desktopansicht

Passende News:

 

Top

AKTUELLE ARTIKEL

AKTUELLE NEWS

25. 2024 - 11:45 Uhr
Sony PDT-FP1 - stabile und einfache Datenübertragung beim Dreh

24. 2024 - 12:00 Uhr
Elevenlabs bietet demnächst auch KI-generierte Soundeffekte an

23. 2024 - 18:35 Uhr
SmallRig bringt umfassendes Retro-Zubehörsystem für Fujifilm X100VI

23. 2024 - 10:46 Uhr
Blackmagic URSA Broadcast G2 mit Cloud Upload und geringerer SDI-Latenz



weitere News: