Text-zu-Video auf neuem Niveau OpenAI Sora - das ist der KI-Video Gamechanger!

// 23:07 Do, 15. Feb 2024von blip

OpenAI präsentiert nach ChatGPT und Dall-E soeben sein erstes KI-Modell für die Videogenerierung - es nennt sich Sora und erstellt bewegte Bilder auf einem absolut sensationellen Niveau. Die über Textprompts erstellten 46 Clips, die das Unternehmen in FullHD (!) auf seiner Webseite zeigt, weisen eine bisher noch nicht gesehene Konsistenz auf, und selbst Menschen im Bild werden deutlich besser dargestellt als bei konkurrienden Text-zu-Video-Modellen. Auch das räumliche Verständnis des Modells ist beeindruckend. Darüberhinaus kann das Modell laut OpenAI in einem Clip mehrere verschiedene Einstellungen generieren (also Schnittfolgen schaffen) und dabei den Inhalt und visuellen Stil beibehalten.

6. Prompt: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually.… pic.twitter.com/AVM9gvNhC2
— Alvaro Cintas (@dr_cintas) February 15, 2024

Introducing Sora, our text-to-video model.

Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W

Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
— OpenAI (@OpenAI) February 15, 2024

Die von Sora generierten Menschen bewegen sich zwar nicht perfekt, auch sie haben noch etwas zombiehaftes, jedoch gelingen sie sehr viel besser als man es in KI-Clips bisher gesehen hat. Landschaften und Tiere sehen extrem realistisch aus. Auch wenn eine Katze dann plötzlich eine Vordertatze zu viel hat. Sieht man sich die Videos genau an, kann man in fast allen Fehler sowie visuelle Hinweise darauf entdecken, dass sie nicht echt sind - aber man muss teilweise sehr genau hinsehen. Manche Videos wiederum weisen so eklatante Fehldarstellungen auf, dass sie wie ein eigenes verrücktes Videogenre wirken.

OpenAI’s new Text to video model “Sora” just announced pic.twitter.com/fvhcwxc6qb
— AI Breakfast (@AiBreakfast) February 15, 2024

7. Prompt: Drone view of waves crashing against the rugged cliffs along Big Sur’s garay point beach. The crashing blue waters create white-tipped waves, while the golden light of the setting sun illuminates the rocky shore. A small island with a lighthouse sits in the distance,… pic.twitter.com/G5eOUeCwHH
— Alvaro Cintas (@dr_cintas) February 15, 2024

even the sora mistakes are mesmerizing pic.twitter.com/OvPSbaa0L9
— Charlie Holtz (@charliebholtz) February 15, 2024

Wie Dall-E aus dem gleichen Hause ist auch Sora ein Diffusionsmodell. Dank der integration mit OpenAIs Sprachmodell ChatGPT ist Sora in der Lage, sehr detaillierte Prompts zu interpretieren und in komplexe Szenen umzusetzen. Zu jedem gezeigten Video gibt OpenAI auch das entsprechende Prompt an - darin finden sich nicht nur ausführliche Beschreibungen der gewünschten Szenerien, sondern auch Anweisungen zur Kamerabewegung. Beispielsweise:

- "The scene is captured from a wide angle, showing the vastness and depth of the ocean. The water is clear and blue, with rays of sunlight filtering through. The shot is sharp and crisp, with a high dynamic range. The octopus and the crab are in focus, while the background is slightly blurred, creating a depth of field effect." Clip

- "The camera follows behind a white vintage SUV with a black roof rack as it speeds up a steep dirt road surrounded by pine trees on a steep mountain slope, dust kicks up from it’s tires, the sunlight shines on the SUV as it speeds along the dirt road, casting a warm glow over the scene." Clip

Richtig spannend sind auch die Fähigkeiten Soras, "historisches" Material herbeizuzaubern, beispielsweise Bilder aus Kalifornien während des Goldrausches.

10. Prompt: Historical footage of California during the gold rush. pic.twitter.com/APqzjHfcz9
— Alvaro Cintas (@dr_cintas) February 15, 2024

Videoclips lassen sich mit einer Länge von bis zu einer Minute erstellen. Auch ein Referenzbild lässt sich als Ausgangsmaterial nehmen. Ebenso kann Sora einen bestehenden Clip erweitern/verlängern oder fehlende Frames ergänzen. Die Videos werden allerdings ohne Ton generiert.

T-Minus 10 seconds until the Hollywood doomer threads begin circulating. https://t.co/3KYmxVMkO9 pic.twitter.com/v54tJtdug1
— fofr (@fofrAI) February 15, 2024

10. Pup pic.twitter.com/ihlxoPBzzS
— Min Choi (@minchoi) February 15, 2024

Sora ist noch nicht frei zugänglich - tatsächlich ist es laut OpenAI gar nicht sicher, dass das Modell jemals als Produkt angeboten werden soll. Wenn ja, sollen C2PA-Metadaten eingebettet werden, um die Videos als KI-generiert erkennbar zu machen.

Zunächst soll Sora jedoch ausgiebig in der Praxis getestet werden, um (so OpenAI) mögliche Risiken auszuloten bzw. robuste Filter zu impementieren. Doch auch einige ausgewählte Künstler, Designer und Filmemacher erhalten Zugang, um zu evaluieren, wie Sora in der Kreativ-Szene genutzt werden kann.

welcome to bling zoo! this is a single video generated by sora, shot changes and all. https://t.co/81ZhYX4gru pic.twitter.com/rnxWXY71Gr
— Bill Peebles (@billpeeb) February 15, 2024

mehr Infos bei
openai.com

Auf Socials teilen:

Leserkommentare // Neueste

Frank Glencairn // 23:34 am 8.4.2024

Ich bin allerdings auch nicht sicher, daß irgendwo in den YT AGBs steht, daß man mit dem Material keine AI trainieren darf. Die Frage ist auch, ob die überhaupt gelten, wenn man...weiterlesen

cantsin // 23:27 am 8.4.2024

Wobei das lizenzrechtlich auf YouTube-Videos nicht zutrifft, es sei denn, sie stehen explizit unter Creative Commons- oder ähnlichen Lizenzen.

Frank Glencairn // 21:27 am 8.4.2024

Überrascht mich nicht wirklich - hat sie in dem Video oben ja gesagt: "We used public available data"

Im Forum mitdiskutieren >>

Ähnliche News //

News

DALL-E 2: KI generiert und editiert Bilder nur anhand von Textbeschreibung

Vor etwas über einem Jahr hatte OpenAI die erste Version von DALL-E gestartet, einem neuronalen Netz, welches Bilder nur anhand einfacher Textbeschreibungen generieren kann. Jetzt ...

// 17:22 So, 10. Apr 2022von Thomas Richter

News

DALL-E 3 ist da und generiert exaktere KI-Bilder inkl. Text dank ChatGPT-Integration

OpenAI hat die neueste Version seines diffusionsbasierten KI-Bildgenerators DALL-E vorgestellt - er ist nun eng mit ChatGPT verzahnt, was gleich mehrere Vorteile bringt. So sollen ...

// 13:37 Do, 21. Sep 2023von blip

News

Zu erschwinglichem Preis? Revolutionäre Video-KI Sora soll noch dieses Jahr kommen

Als OpenAI seinen KI-Videogenerator Sora vor einem Monat vorstellte, betonte das Unternehmen, es würde noch dauern, bis das Text-zu-Video-Modell öffentlich zugänglich gemacht ...

// 16:34 Do, 14. Mär 2024von blip

News

Stockphoto-Portal Shutterstock integriert KI-Bilder und gibt eine Antwort auf die ...

Seit kurzem steht die Frage im Raum, wie Künstler und Stock-Fotodienste überleben können, wenn bildgenerierende KIs wie DALL-E 2, Stable Diffusion oder Midjourney beliebige Bilder ...

// 09:41 Sa, 5. Nov 2022von Thomas Richter

News

Neue Studie Was werden KI-Videogeneratoren wie Open AI Sora im kommerziellen Einsatz kosten?

Sora hatte vor nicht einmal zwei Monaten die Welt verblüfft, weil es eine bisher noch niemals dagewesene Qualität bei KI-generierten Videos demonstrierte. In einem Blogbeitrag der ...

// 11:14 Mo, 8. Apr 2024von Rudi Schmidts

zur Newsübersicht >

Generative Video-KI-Funktionen Adobe Firefly für Premiere Pro - Generative Extend, Object removal/addition

Zuletzt im Oktober hatte Adobe Firefly-Funktionen für Premiere Pro geteasert, darunter eine Generative Fill-Funktion - nun wird es konkret. Denn noch in diesem Jahr sollen über ...

// 15:08 Mo, 15. Apr 2024von blip

News

Übernahme ist durch RED ist nun eine Nikon-Tochter - und Jarred Land abgesetzt

Rechtzeitig zur NAB gab Nikon bekannt, die Übernahme von RED sei nun zu 100% vollzogen. Ab sofort werden Jarred Land zusammen mit James Jannard nur noch enge Berater der Nikon-...

// 14:13 So, 14. Apr 2024von blip

News

Günstiger und besser? Blackmagic stellt neues DaVinci Resolve Micro Color Panel für 495 Dollar vor

Blackmagic Design hat auf der NAB mit dem DaVinci Resolve Micro Color Panel ein weiteres, besonders erschwingliches Pult für die Farbkorrektur mit DaVinci Resolve angekündigt, ...

// 09:06 Sa, 13. Apr 2024von Rudi Schmidts

News

Blackmagic PYXIS 6K: Die Vollformat "Box"-Kamera mit Viewfinder, 2x SDI, Sideplates (!) uvm.

Am vielseitigsten riggbare Cam Blackmagic PYXIS 6K: Die Vollformat „Box“-Kamera mit Viewfinder, 2x SDI, Sideplates ...

Von vielen seit langem ersehnt und jetzt da: Blackmagic stellt mit der Pyxis 6K gleich drei leistungsstärkere Vollformat-Versionen seiner Cinema Camera 6K vor, die in ein ...

// 03:40 Sa, 13. Apr 2024von Rob

TOP THEMEN //

zum Forum >>

MEHR NEWS

zum Newsindex >

PASSENDE DISKUSSIONEN

zum Forum >>

Passende Artikel //

Aktuelles

Stoppt Mickey Mouse die KI Kunst Revolution? Künstler protestieren gegen KI Konkurrenz

Die neuen bildgenerierenden KIs stellen eine Revolution dar: sie eröffnen erstmals die Möglichkeit, massenhaft hochqualitative Bilder nach Wunsch zu erzeugen - in beliebiger Menge,...

// 14:21 Di, 3. Jan 2023von Thomas Richter

Aktuelles

Text-zu-Sprache per KI: Ersetzen synthetische Stimmen bald professionelle Sprecher?

Nach Bild- und Text-generierenden KIs gibt es noch weiteres Feld, in welchem gerade per künstlicher Intelligenz enorme Fortschritte gemacht werden und zwar bei der Synthese von ...

// 19:47 Mo, 6. Feb 2023von Thomas Richter

zur Artikelübersicht >

Was hältst du von den neuen Bild/Video-KIs?
Toll, so viele neue Kreativtools!
Sie werden das Filmemachen vereinfachen
Sie werden das Filmen z.T. ersetzen
Sie werden mich arbeitslos machen
Die sind völlig überbewertet

Ergebnis ansehen

Aktuelle News //

News

Volle Kontrolle über die Cloud Neue Blackmagic Cloud Store Max Speicherlösungen mit 24 und 48 TB

Blackmagic Design hat zwei neue Blackmagic Cloud Store Max Modelle im HE-Formast für die Netzwerkspeicherung angekündigt. Diese sind wahlweise mit 24 oder 48 TB Flashspeicher, ...

// 11:33 Sa, 27. Apr 2024von Thomas Richter

News

Digital Twin auf YouTube Videointerview mit dem eigenem KI-Zwilling

Auch wenn wir seit fast zwei Jahren die Fortschritte von generativer KI mitverfolgen dürfen, gibt es immer wieder noch ziemlich überraschende Auswüchse, die wir so noch gar nicht ....

// 12:27 Fr, 26. Apr 2024von Rudi Schmidts

zur Newsübersicht >