Meta Emu Video / Edit - verbessert Konsistenz in generativen KI Videos

// 07:37 Mo, 20. Nov 2023von Rudi Schmidts

Der Bereich der generativen KI entwickelt sich weiterhin mit großen Schritten und Meta stellt sich in letzter Zeit als einer der besonders treibenden Motoren heraus. Ein für slashCAM besonders interessantes Feld ist dabei natürlich die Video-Generierung, für die Meta nun ein neues Modell namens Emu vorgestellt hat.

Auch wenn generative Bilder für sich genommen bereits beeindruckend fehlerfrei sein können, gelingen bis dato noch keine glaubhaften Animationen, die durchgehend konsistent wirken. Zugleich gibt es auch das grundsätzliche Problem, dass sich mit der Änderung einer Texteingabe (eines sog. Prompts) oft der gesamte Bildinhalt ändert und nicht nur ein selektiver Teil. Für beide Probleme will Emu nun gleichzeitig neue, interessante Lösungsansätze bieten.

Emu Video basiert auf Diffusionsmodellen und besitzt eine einheitliche Architektur für Videogenerierungsaufgaben, die auf eine Vielzahl von Eingaben reagieren kann: Nur Text, nur Bild und sowohl Text als auch Bild. Der Prozess besteht dabei aus zwei Stufen; Zuerst das Generieren von Bildern, die auf eine Texteingabeaufforderung konditioniert sind, und anschließend das Generieren von Videos, die sowohl auf den Text als auch auf das generierte Bild konditioniert sind.

Meistens ist ja das generierte Video anschließend nicht ganz das, was man sich vorgestellt hat. Da aber nicht jeder Lust und Zeit hat, sich intensiv mit Prompt Engineering zu befassen, wäre es deutlich leichter, wenn man im Anschluss nur noch Änderungswünsche eingibt, ohne das Video jedoch in seinen grundsätzlichen Eigenschaften zu ändern. Und genau hier kommt Emu Edit ins Spiel .

Emu Edit soll in der Lage sein, Bearbeitungen durch nachträgliche Anweisungen durchzuführen. Hiermit sollen Aufgaben wie lokale und globale Bearbeitung, Entfernen und Hinzufügen eines Hintergrunds, Farb- und Geometrietransformationen, Erkennung und Segmentierung und vieles mehr möglich sein.

Im Gegensatz zu anderen Modellen versucht Emu Edit, nur betroffene Pixel zu ändern, die für die Bearbeitungs-Anforderung relevant sind. Im Gegensatz zu vielen generativen KI-Modellen folgt Emu Edit also den Anweisungen möglichst präzise und versucht, dass Pixel im Eingabebild, die nichts mit den Anweisungen zu tun haben, unberührt bleiben.

Gelungen ist dies durch einen speziellen Trainingsdatensatz, der 10 Millionen synthetisierte Samples enthält, die jeweils ein Eingabebild, eine Beschreibung der auszuführenden Aufgabe und das Zielausgabebild enthalten. Ein weiteres mal scheint sich hier zu bewahrheiten, dass gute Daten weitaus wertvoller sind als reine Rechenleistung.

Sieht man sich die Ergebnisse an, so darf man wohl durchaus von einem weiteren Meilenstein in der KI-Entwicklung sprechen. Alle gezeigten Videos sind temporal erstaunlich konsistent und die Samples für Emu Edit lassen wirklich den grundsätzlichen Stil der Videos unberührt.

Wie wir bereits oft erwähnt haben, entwickelt sich generative KI für Bewegtbilder mit Sieben Meilen Stiefeln. Und die Transformation dieser Modelle auf fotorealistische Aufnahmen ist mit Sicherheit keine 12 Monate mehr entfernt. In diesem Sinne, schnellt euch schon mal für 2024 an...

mehr Infos bei
ai.meta.com

Auf Socials teilen:

Leserkommentare // Neueste

Kommentieren >>

Ähnliche News //

News

Schlägt Meta Stable Diffusion XL mit Ästhetik? Emu trainiert "vom Feinsten"

Nachdem Open AI ja gerade mit Dall-E 3 die KI-News beherrscht, holt Meta zum nächsten Streich in der Liga der generativen Diffusions-Modelle aus. Zwar wurde "Emu" noch nicht ...

// 10:49 Mo, 16. Okt 2023von Rudi Schmidts

News

Midjourney will bei KI-generierten Videos mitmischen - Video-Modell-Training ...

Die Macher von Midjourney kündigten vor ein paar Tagen an, dass sie zu gegebener Zeit ein weiteres "Text-to-Video"-Modell einführen wollen. Erste Versuche gab es schon einmal mit ....

// 13:00 Sa, 6. Jan 2024von Rudi Schmidts

News

Meta Emu KI-Bildgenerator - online kostenlos, jedoch aktuell nur in den USA

Nicht, dass es der Welt gerade an KI-Bildgeneratoren mangeln würde - neben den bekanntesten Vertretern wie Midjourney, Dall-E, Stable Diffusion oder Firefly tummeln sich auch noch ...

// 15:12 Do, 7. Dez 2023von Rudi Schmidts

News

Blackmagic DaVinci Resolve 17.4 bringt 5fache Beschleunigung für neue MacBook Pros, ...

Die Versionsnummer läßt es nicht vermuten, aber das neue Update auf die Version 17.4 bringt Blackmagics Grading-, Schnitt-, Compositing- und Audio-Mastering-Programm DaVinci ...

// 12:33 Fr, 22. Okt 2021von Thomas Richter

News

KI-generierte Videos: Was geht mit Runway? Pizza-Magic, Katzen und mehr

Die KI-Entwicklung schläft nicht - während wir noch dabei sind, für die Newsstrecke diverse neue Video-Tools aufzuarbeiten, die während der NAB vorgestellt wurden, möchten wir ...

// 09:23 So, 30. Apr 2023von blip

zur Newsübersicht >

Ohne Führerschein Mini 4K - DJIs günstigste 4K/30p Drohne kostet nur 299 US-Dollar

DJIs neueste Kameradrohne, die Mini 4K, bleibt weiterhin unter 250 Gramm und darf deswegen ohne Führerschein geflogen werden. Mit einem Preis von 299 Dollar ist sie zugleich DJIs ....

// 13:45 Di, 30. Apr 2024von Rudi Schmidts

News

Update: Postproduktions-Suite DaVinci Resolve 19: Die neuen Funktionen ausführlich erklärt

Am Blackmagic-Stand auf der NAB 2024 gibt uns Simon von Blackmagic Design einen detaillierten Einblick in die neuen Funktionen von DaVinci Resolve 19. Wir schauen uns ColorSlice, ....

// 15:38 Di, 23. Apr 2024von Rob

News

Profi-Kamera App kostenlos Blackmagic Camera App bald auch für Android Smartphones

Blackmagic hatte ja im Vorfeld der NAB 2024 seine beliebte Camera App für das iPhone in einer erneuerten Version 1.3 vorgestellt. Doch eine "Kleinigkeit" blieb dabei im News-...

// 14:31 Mo, 15. Apr 2024von Rudi Schmidts

News

Übernahme ist durch RED ist nun eine Nikon-Tochter - und Jarred Land abgesetzt

Rechtzeitig zur NAB gab Nikon bekannt, die Übernahme von RED sei nun zu 100% vollzogen. Ab sofort werden Jarred Land zusammen mit James Jannard nur noch enge Berater der Nikon-...

// 14:13 So, 14. Apr 2024von blip

TOP THEMEN //

zum Forum >>

MEHR NEWS

zum Newsindex >

PASSENDE DISKUSSIONEN

zum Forum >>

Passende Artikel //

Meinung

Midjourney trifft Pika Labs: Generative KI -Videos - Was geht, was kommt?

Seitdem Midjourney oder Stable Diffusion fotorealistische Bilder generieren kann, will man natürlich auch realistische Bewegungen "digital erträumen". Doch das erweist sich für ...

// 10:22 Fr, 29. Sep 2023von Rudi Schmidts

Test

Blackmagic ATEM Mini Pro ISO im Livestreaming Setup mit Blackmagic Studio Camera 4K Plus

Die aktuelle Blackmagic Studio Camera 4K Plus und der ATEM Mini Pro ISO Mischer (aka Streaming-Box) sind in der slashCAM Redaktion eingetroffen und wir erkunden hier die ...

// 08:18 Do, 14. Okt 2021von Rob

zur Artikelübersicht >

Was hältst du von den neuen Bild/Video-KIs?
Toll, so viele neue Kreativtools!
Sie werden das Filmemachen vereinfachen
Sie werden das Filmen z.T. ersetzen
Sie werden mich arbeitslos machen
Die sind völlig überbewertet

Ergebnis ansehen

Aktuelle News //

News

Postproduktions Suite DaVinci Resolve 19 Public-Beta 2 zum freien Download verfügbar

Blackmagic bleibt seinen gewohnt zügigen Beta-Releases treu und hat soeben Version 2 von DaVinci Resolve und DaVincie Resolve Studio Public Beta 19 zum freien Download zur ...

// 09:12 Fr, 3. Mai 2024von Rob

News

Seltsame Statistik Windows 10 gewinnt weiter Marktanteile gegenüber Windows 11

Wie unterem Golem entdeckt hat, gibt es aktuell auf statcounter eine auf den ersten Blick seltsame Statistik zu bewundern: So zeigt sich dort, dass in den letzten Monaten der ...

// 17:22 Do, 2. Mai 2024von Rudi Schmidts

zur Newsübersicht >