Erweckte Standbilder EMO - KI lässt Portraits sprechen und singen

// 15:04 Do, 29. Feb 2024von Rudi Schmidts

In den letzten Jahren hat der Bereich der KI-Bilderzeugung bemerkenswerte Fortschritte erlebt, die zuletzt vor allem auf Diffusionsmodellen basieren. Solche Modelle wie Stable Diffusion oder Midjourney verdanken ihre Leistungsfähigkeit einem umfangreichen Training mit großflächigen Bilddatensätzen und einem progressiven Generierungsansatz aus Rauschen. Dieser ermöglicht die Erstellung von Bildern mit beispielloser Detailgenauigkeit und Realismus und setzt immer noch fast wöchentlich neue Maßstäbe im Bereich der generativen Modelle.

Die Anwendung von Diffusionsmodellen ist jedoch nicht nur auf Standbilder beschränkt. Ein wachsendes Interesse an der Videogenerierung hat dazu geführt, dass das Potenzial dieser Modelle bei der Erstellung dynamischer und überzeugender visueller Darstellung aktuell gerade überall auf der Welt mit extrem hohen Mittel- (sprich GPU-) Einsatz erforscht wird.

Ein spezielles Gebiet der KI-Videosynthese stellt die Generierung von menschenzentrierten Videos dar, deren Portraits künstlich animiert werden (sog. Talking Heads).

KI EMO lässt Standbild-Portraits sprechen und singen

Das Ziel einer gelungenen Talking Head Synthese ist es, Feinheiten in der Vielfalt menschlicher Gesichtsbewegungen glaubhaft zu "erfinden" und darzustellen. Bisherige Ansätze legten dabei oft Einschränkungen für die endgültige Videoausgabe fest, und generieren die Gesichter der Darsteller eher statisch, was steif und unnatürlich wirkt.

Ein chinesisches Forschungsteam aus dem Kreis der Alibaba Group, hat nun ein innovatives KI-Talking Head-Framework vorgestellt (EMO - Emote Portrait Alive), welches nicht nur ein breites Spektrum realistischer Gesichtsausdrücke mit viel Bewegung, einschließlich nuancierter Mikroausdrücke erzeugen kann. Auch werden die Emotionen für die Animation direkt aus der Audiodatei "extrahiert".

Kurz gesagt, dieses Modell erwartet als Input nur ein Portraitfoto und eine Audio-Datei mit Sprache oder Gesang und produziert daraus einen Videoclip, der das Portrait extrem realistisch sprechen oder singen lässt. Einfacher gehts wohl kaum noch, ein Photo zu animieren.

Die bislang präsentierten Ergebnisse sind dabei fast durchgehend gelungen. Auch wenn bei schwierigen Passagen der eine oder andere Fehler sofort ins Auge fällt, gibt es auch in fast jedem Videclip längere Abschnitte, in denen man nicht glauben würde, hier gerade einer KI zuzusehen.

Uns fehlen langsam die Worte für die täglichen Sprünge in der KI-Entwicklung, aber langweilig wird es immerhin bis auf absehbare Zeit wohl eher nicht...

mehr Infos bei
humanaigc.github.io

Auf Socials teilen:

Leserkommentare // Neueste

Kommentieren >>

Ähnliche News //

News

Kostenlose Bildgenerierung per KI: Stable Diffusion jetzt mit einfachem Installer

Vor kurzem wurde die Text-zu-Bild KI Stable Diffusion veröffentlicht, mit deren Hilfe man kostenlos auf dem eigenen Computer auch zuhause auf dem eigenen PC phantastische Bildern ....

// 11:00 Di, 13. Sep 2022von Thomas Richter

News

Microsoft Olive: Neues kostenloses Tool verdoppelt Performance von Stable Diffusion

Microsoft hat ein neues, freies Tool namens Olive vorgestellt, welches vielen KI-Modellen wie zum Beispiel Stable Diffusion ermöglicht, automatisch die Hardwarebeschleunigung von ....

// 18:08 Mi, 24. Mai 2023von Thomas Richter

News

Bild-KI Midjourney V5 liefert fotorealistische Bilder - und endlich auch korrekte ...

Midjourney, eine der drei großen bildgenerierenden KIs, hat mit der eben erschienenen neuen (Alpha)Version 5 einen weiteren großen Schritt gemacht: die produzierten Bilder weisen ....

// 12:24 So, 19. Mär 2023von Thomas Richter

News

Pro Bild nur 15 Sekunden: Stable Diffusion läuft auf Smartphone

Ursprünglich war eine dedizierte Grafikkarte mit mindestens 8 GB VRAM die Voraussetzung, um auf dem eigenen Computer Bilder mittels der freien Text-zu-Bild-KI Stable Diffusion zu ....

// 17:35 Di, 14. Mär 2023von Thomas Richter

News

KI Bilder mit Stable Diffusion jetzt auch direkt in Photoshop und Gimp erzeugen

Die bildgenerierende KI Stable Diffusion kann seit kurzem einfach auf dem eigenen PC genutzt werden, doch gibt es jetzt einen noch einfacheren Weg. Der Programmierer und Künstler ....

// 10:51 So, 18. Sep 2022von Thomas Richter

zur Newsübersicht >

Calman Ready und 98% DCI-P3 Neue Monitorserie AOC Graphic Pro U3 für Profis

AOC hat die neue Graphic Pro U3 Monitorserie vorgestellt, die ganz auf professionelle User aus den Bereichen Video- und Bildbearbeitung zielt. Die Pro-Features umfassen die ...

// 13:57 So, 28. Apr 2024von Thomas Richter

News

Update: Postproduktions-Suite DaVinci Resolve 19: Die neuen Funktionen ausführlich erklärt

Am Blackmagic-Stand auf der NAB 2024 gibt uns Simon von Blackmagic Design einen detaillierten Einblick in die neuen Funktionen von DaVinci Resolve 19. Wir schauen uns ColorSlice, ....

// 15:38 Di, 23. Apr 2024von Rob

News

Spezifikationen geleakt AMDs Notebook APU Strix Halo - besser als Apples M3 Pro Chip?

Wir hatten uns ja noch vor drei Monaten darüber beschwert, dass im PC-Bereich die CPU-Entwicklung langsamer als notwendig voranschreitet. Doch nun lichten sich endlich die ...

// 14:05 Mo, 22. Apr 2024von Rudi Schmidts

News

Profi-Kamera App kostenlos Blackmagic Camera App bald auch für Android Smartphones

Blackmagic hatte ja im Vorfeld der NAB 2024 seine beliebte Camera App für das iPhone in einer erneuerten Version 1.3 vorgestellt. Doch eine "Kleinigkeit" blieb dabei im News-...

// 14:31 Mo, 15. Apr 2024von Rudi Schmidts

TOP THEMEN //

zum Forum >>

MEHR NEWS

zum Newsindex >

PASSENDE DISKUSSIONEN

zum Forum >>

Passende Artikel //

Aktuelles

Die Stable Diffusion Revolution: Kostenlose Bildgenerierung per KI jetzt auch auf dem Heim-PC

Seit ein paar Tagen ist es endlich soweit: die Text-zu-Bild KI Stable Diffusion wurde veröffentlicht und kann kostenlos auf dem eigenen Computer genutzt werden - damit ist jetzt ...

// 15:03 Di, 30. Aug 2022von Thomas Richter

Praxis

Stable Diffusion - Tipps und Tricks - Teil 1 - Einrichtung und Einstieg

Unter allen kostenlosen KI-Modellen sticht Stable Diffusion nicht nur durch seine großartige Bildqualität hervor. Es lässt sich sogar auf dem heimischen Rechner installieren...

// 11:52 Fr, 17. Mär 2023von Rudi Schmidts

zur Artikelübersicht >

Was hältst du von den neuen Bild/Video-KIs?
Toll, so viele neue Kreativtools!
Sie werden das Filmemachen vereinfachen
Sie werden das Filmen z.T. ersetzen
Sie werden mich arbeitslos machen
Die sind völlig überbewertet

Ergebnis ansehen

Aktuelle News //

News

7.5. in München + Livestream Kooperation: Digitalschnittmesse und camgaroo film festival im ARRI-Kino

Zum ersten Mal seit fünf Jahren findet morgen - Dienstag den 7. Mai 2024 - in München wieder die Digitalschnittmesse statt, wo sich in leicht geschrumpftem Umfang (anderen Messen ....

// 13:51 Mo, 6. Mai 2024von blip

News

Canon Vollformat DSLM Canon USA startet Teaser Kampagne – EOS R5 Mark II kurz vor offizieller Vorstellung?

Canon USA scheint auf X (Twitter) eine Teaser-Kampagne gestartet zu haben, die ein Kind mit einer Canon DSLM zeigt und einem Verweis auf „exciting news“ (aufregende Neuigkeiten), ....

// 09:49 Mo, 6. Mai 2024von Rob

zur Newsübersicht >