Lumière - Google präsentiert KI Raum-Zeit-Diffusionsmodell für konsistente Videos

// 13:21 Mi, 24. Jan 2024von Rudi Schmidts

Wie wir bereits seit längerem gemutmaßt haben, will Google sich natürlich nicht lumpen lassen und auch im aufkeimenden KI-Video-Club mitspielen! Zwar gab es schon im Vorfeld mehrere Text2Video Modelle aus dem Hause des größten Suchmaschinen-Betreibers und Youtube-Besitzers - aber mit Lumière stellt Google nun sein erstes State-Of-The-Art (SotA) KI-Generierungstool vor, welches aktuelle Probleme der Bewegungskonsistenz besser zu lösen scheint, als die Konkurrenz.

Lumière basiert auf einem Text-zu-Video-Diffusionsmodell, das für die Synthese von Videos entwickelt wurde, um realistische, vielfältige und kohärente Bewegungen darzustellen. Zu diesem Zweck stellt Google in seinem zugehörigen Paper die Space-Time U-Net-Architektur vor.

Aktuelle Modelle berechnen zuerst Keyframes, um in weiteren Durchgängen zwischen diesen Standbildern temporale Zwischenbilder zu erzeugen. Ein Ansatz, der es von Natur aus schwierig macht, zeitliche Konsistenz über den gesamten Bildinhalt zu erreichen.

Google Lumière - KI Raum-Zeit-Diffusionsmodell

Im Gegensatz zur Konkurrenz erzeugt Lumière dagegen den gesamten Clip mit einem einzigen Durchgang im Modell. Durch den Einsatz von zeitlichem Down- und Up-Sampling und der Nutzung eines vortrainierten Text-zu-Bild-Diffusionsmodells kann Lumière so direkt "in einem Rutsch" ein Video mit voller Bildrate und niedriger Auflösung erzeugen.

Die präsentierten Ergebnisse erscheinen uns gerade bezüglich der Bewegungs-Konsistenz wirklich außergewöhnlich gut. Ebenfalls interessant ist dabei zu sehen, dass Lumière auch weitere Möglichkeiten bei der Erstellung des Videos bieten wird ( Bild-zu-Video, Video-Inpainting und stilisierte Generierung).

Wie das alles bei Google anschließend zusammen spielen kann, zeigt das folgende Video sehr anschaulich:

Natürlich sind auch diese Ergebnisse sicherlich "cherry picked", aber wir denken, es genügt um zu sehen, dass man Google im Rennen um die KI-Videogeneratoren nicht unterschätzen sollte. Eine Möglichkeit Lumière selbst auszuprobieren, gibt es allerdings noch nicht.

mehr Infos bei
lumiere-video.github.io

Auf Socials teilen:

Leserkommentare // Neueste

Kommentieren >>

Ähnliche News //

News

Text-zu-Video KI jetzt auch von Google: Imagen Video

Nachdem Meta gerade seine Make-a-Video KI zur Generierung von Videos nach Textbeschreibung vorgestellt hatte, hat Google jetzt nachgezogen und mit Imagen Video auch eine solche KI ...

// 16:48 Do, 6. Okt 2022von Thomas Richter

News

Bald filmreif? Neue NVIDIA-KI erzeugt hochauflösende Videos per Texteingabe

Schneller als noch vor kurzem gedacht verbessert sich die Qualität von Text-zu-Video-KIs. Waren vor kurzer Zeit vorgestellte Video-KIs wie Metas Make-a-Video, Googles Imagen und ....

// 10:28 Do, 20. Apr 2023von Thomas Richter

News

Stable Video Diffusion - Freies KI-Diffusionsmodell zur Videoerzeugung vorgestellt

Natürlich war es nur eine Frage der Zeit, bis auch das Stable Diffusion Team ein eigenes KI-Modell für Bewegtbilder ins Rennen schicken würde und dieser Tag ist nun gekommen. ...

// 09:07 Do, 23. Nov 2023von Rudi Schmidts

News

Stockphoto-Portal Shutterstock integriert KI-Bilder und gibt eine Antwort auf die ...

Seit kurzem steht die Frage im Raum, wie Künstler und Stock-Fotodienste überleben können, wenn bildgenerierende KIs wie DALL-E 2, Stable Diffusion oder Midjourney beliebige Bilder ...

// 09:41 Sa, 5. Nov 2022von Thomas Richter

News

Erst Bilder, dann Sounds: Neue Google-KI generiert beliebige Musik nach ...

Forscher von Google haben eine neue KI vorgestellt, die nach einem ähnlichen Muster wie die gerade sehr populären Text-2-Image KIs wie DALL-E 2, Midjourney oder Stable Diffusion .....

// 10:57 Mo, 30. Jan 2023von Thomas Richter

zur Newsübersicht >

Ohne Führerschein Mini 4K - DJIs günstigste 4K/30p Drohne kostet nur 299 US-Dollar

DJIs neueste Kameradrohne, die Mini 4K, bleibt weiterhin unter 250 Gramm und darf deswegen ohne Führerschein geflogen werden. Mit einem Preis von 299 Dollar ist sie zugleich DJIs ....

// 13:45 Di, 30. Apr 2024von Rudi Schmidts

News

Update: Postproduktions-Suite DaVinci Resolve 19: Die neuen Funktionen ausführlich erklärt

Am Blackmagic-Stand auf der NAB 2024 gibt uns Simon von Blackmagic Design einen detaillierten Einblick in die neuen Funktionen von DaVinci Resolve 19. Wir schauen uns ColorSlice, ....

// 15:38 Di, 23. Apr 2024von Rob

News

Profi-Kamera App kostenlos Blackmagic Camera App bald auch für Android Smartphones

Blackmagic hatte ja im Vorfeld der NAB 2024 seine beliebte Camera App für das iPhone in einer erneuerten Version 1.3 vorgestellt. Doch eine "Kleinigkeit" blieb dabei im News-...

// 14:31 Mo, 15. Apr 2024von Rudi Schmidts

News

Übernahme ist durch RED ist nun eine Nikon-Tochter - und Jarred Land abgesetzt

Rechtzeitig zur NAB gab Nikon bekannt, die Übernahme von RED sei nun zu 100% vollzogen. Ab sofort werden Jarred Land zusammen mit James Jannard nur noch enge Berater der Nikon-...

// 14:13 So, 14. Apr 2024von blip

TOP THEMEN //

zum Forum >>

MEHR NEWS

zum Newsindex >

PASSENDE DISKUSSIONEN

zum Forum >>

Passende Artikel //

Praxis

Mattepainting für Dummys - mit Photoshops Generative Fill Funktion

Wir hatten schon einmal kurz auf Photoshops "Generative Fill"-Möglichkeiten im Zusammenhang mit Videoaufnahmen hingewiesen. In diesem Workshop möchten wir zeigen, wie die ...

// 13:26 Mi, 16. Aug 2023von Rudi Schmidts

Praxis

ACES in Theorie und Praxis Teil 2: Der ACES Workflow in Blackmagic DaVinci Resolve

ACES ist für viele nur ein theoretischer Begriff. Wir wollen zeigen, wie man in DaVinci Resolve einen ACES Workflow korrekt einstellen kann...

// 09:32 Mi, 15. Sep 2021von Rudi Schmidts

zur Artikelübersicht >

Was hältst du von den neuen Bild/Video-KIs?
Toll, so viele neue Kreativtools!
Sie werden das Filmemachen vereinfachen
Sie werden das Filmen z.T. ersetzen
Sie werden mich arbeitslos machen
Die sind völlig überbewertet

Ergebnis ansehen

Aktuelle News //

News

KI Video Generator Vidu - die chinesische Antwort auf OpenAI Sora?

Das chinesische Technologieunternehmen ShengShu-AI und die Tsinghua-Universität haben am Wochenende ein KI-Video-Modell vorgestellt, welches nach nach eigenen Angaben mit Open AIs ...

// 12:56 Do, 2. Mai 2024von Rudi Schmidts

News

Global Shutter Kamera Sony A9III Firmware Update 2.0: C2PA Unterstützung, SFTP und mehr

Sony hat für seine Flaggschiff Vollformat Global Shutter Kamera A9III ein größeres Firmwareupdate mit der Version 2.0 mit wichtigen, neuen Funktionen zum freien Download zur ...

// 08:28 Mi, 1. Mai 2024von Rob

zur Newsübersicht >