Neue Nvidia-KI generiert Bilder 30x schneller als Stable Diffusion

// 16:10 Mi, 8. Mär 2023von Thomas Richter

Ein Forscherteam von Nvidia und der Universität Tübingen hat eine neue (alte) Methode zur Bildgenerierung per KI vorgestellt, welche gleich zwei große Vorteile gegenüber der bisher verwendeten aufweist. Das neue, StyleGAN-T getaufte Verfahren basiert ganz klassisch auf GANs (Generative Adverserial Network), welches von Nvidia schon lange in Form von StyleGAN für mehrere interessante Anwendungen eingesetzt wurde, wie zum Beispiel schon 2018 für die Generierung beliebiger menschlicher Gesichter oder das künstliche Altern von Gesichtern.

Neue Nvidia-KI generiert Bilder 30x schneller als Stable Diffusion

Dieses Verfahren kann dank der neuen Forschungen jetzt auch Bilder per Prompt generieren, ganz so wie die aktuellen Bild-KIs, wie etwa DALL-E2, Midjourney oder das quelloffene und deswegen am weitesten verbreitete Stable Diffusion. Diese setzen alle auf das latent Diffusion Model, um Bilder aus Text zu erzeugen. Demgegenüber zeichnet sich das neue StyleGAN-T Verfahren durch zwei besondere Eigenschaften aus: es ist deutlich schneller und kann besser zwischen den Ergebnissen unterschiedlicher Prompts morphen.

Wie schnell StyleGAN-T ist (und wie gut es nahezu stufenlos von einem zu einem anderen Bild wechseln kann), demonstriert das folgende Video sehr gut, in welchem jeder 512 x 512 Pixelausschnitt in 0.1 Sekunden - d.h. nahezu in Echtzeit - auf einer Nvidia A100 Tensor Core GPU generiert wurde:

Deutlich wird der Unterschied in der Geschwindigkeit der Bildgenerierung auch in der folgenden Übersicht, einem Vergleich mit anderen Bild-KIs wie Stable Diffusion und Googles Imagen. Hier ist das neue Verfahren 37x schneller als Stable Diffusion und über 90x schneller als Imagen.

Auf schwächeren GPUs als der hochspezialisierten Nvidia A100 läuft die Bildgenerierung natürlich langsamer als 0.1 Sekunden pro Bild, aber die relative Geschwindigkeit gegenüber den per Diffusion erzeugten Bildern sollte in etwa bestehen bleiben. Zum Vergleich: auf einer Nvidia RTX 3090 dauert die Generierung von 56 Bildern mit 512 × 512 Auflösung rund 6 Sekunden. Trainiert wurde StyleGAN-T 4 Wochen lang auf 64 Nvidia A100 GPUs, d.h. mit recht begrenzter Leistung - würde mehr Ressourcen ins Training investiert, könnte die Bildqualität vermutlich noch weiter gesteigert werden.

Der zweite Vorteil der Erzeugung von Bildern per GANs ist die für die Möglichkeit, den Latent Space zu erkunden, d.h. zwischen verschiedenen Ergebnisse zu interpolieren und so visuell zwischen unterschiedlichen Ergebnissen bei gleichen oder auch anderen Textprompts zu morphen, um sie nahtlos ineinander übergehen zu lassen.

Diese allgemeine Fähigkeit von (Bild-)GANs wird recht verständlich im folgenden Clip von 2 Minute Paper demonstriert:

mehr Infos bei
sites.google.com

Auf Socials teilen:

Leserkommentare // Neueste

Frank Glencairn // 09:04 am 9.3.2023

In a nut shell: beim aktuellen Stand der Dinge - vergiss es.

Jalue // 08:36 am 9.3.2023

Liebe Redaktion, das ist ja alles sehr interessant, wobei ich als Mensch mit bestenfalls durchschnittlichem IT-Wissen (womit ich für die Mehrheit der User hier stehen dürfte)...weiterlesen

Im Forum mitdiskutieren >>

Ähnliche News //

News

Kostenlose Bildgenerierung per KI: Stable Diffusion jetzt mit einfachem Installer

Vor kurzem wurde die Text-zu-Bild KI Stable Diffusion veröffentlicht, mit deren Hilfe man kostenlos auf dem eigenen Computer auch zuhause auf dem eigenen PC phantastische Bildern ....

// 11:00 Di, 13. Sep 2022von Thomas Richter

News

Microsoft Olive: Neues kostenloses Tool verdoppelt Performance von Stable Diffusion

Microsoft hat ein neues, freies Tool namens Olive vorgestellt, welches vielen KI-Modellen wie zum Beispiel Stable Diffusion ermöglicht, automatisch die Hardwarebeschleunigung von ....

// 18:08 Mi, 24. Mai 2023von Thomas Richter

News

Pro Bild nur 15 Sekunden: Stable Diffusion läuft auf Smartphone

Ursprünglich war eine dedizierte Grafikkarte mit mindestens 8 GB VRAM die Voraussetzung, um auf dem eigenen Computer Bilder mittels der freien Text-zu-Bild-KI Stable Diffusion zu ....

// 17:35 Di, 14. Mär 2023von Thomas Richter

News

Google optimiert Stable Diffusion für Smartphones: Ein Bild in nur 12 Sekunden

Forscher von Google haben Stable Diffusion 1.4 so weit optimiert, dass die Erzeugung eines 512x512 Bildes auf einem modernen Smartphone wie dem Samsung S23 Ultra in weniger als 12 ...

// 13:22 Mi, 26. Apr 2023von Thomas Richter

News

KI Bilder mit Stable Diffusion jetzt auch direkt in Photoshop und Gimp erzeugen

Die bildgenerierende KI Stable Diffusion kann seit kurzem einfach auf dem eigenen PC genutzt werden, doch gibt es jetzt einen noch einfacheren Weg. Der Programmierer und Künstler ....

// 10:51 So, 18. Sep 2022von Thomas Richter

zur Newsübersicht >

Generative Video-KI-Funktionen Adobe Firefly für Premiere Pro - Generative Extend, Object removal/addition

Zuletzt im Oktober hatte Adobe Firefly-Funktionen für Premiere Pro geteasert, darunter eine Generative Fill-Funktion - nun wird es konkret. Denn noch in diesem Jahr sollen über ...

// 15:08 Mo, 15. Apr 2024von blip

News

Übernahme ist durch RED ist nun eine Nikon-Tochter - und Jarred Land abgesetzt

Rechtzeitig zur NAB gab Nikon bekannt, die Übernahme von RED sei nun zu 100% vollzogen. Ab sofort werden Jarred Land zusammen mit James Jannard nur noch enge Berater der Nikon-...

// 14:13 So, 14. Apr 2024von blip

News

Günstiger und besser? Blackmagic stellt neues DaVinci Resolve Micro Color Panel für 495 Dollar vor

Blackmagic Design hat auf der NAB mit dem DaVinci Resolve Micro Color Panel ein weiteres, besonders erschwingliches Pult für die Farbkorrektur mit DaVinci Resolve angekündigt, ...

// 09:06 Sa, 13. Apr 2024von Rudi Schmidts

News

Blackmagic PYXIS 6K: Die Vollformat "Box"-Kamera mit Viewfinder, 2x SDI, Sideplates (!) uvm.

Am vielseitigsten riggbare Cam Blackmagic PYXIS 6K: Die Vollformat „Box“-Kamera mit Viewfinder, 2x SDI, Sideplates ...

Von vielen seit langem ersehnt und jetzt da: Blackmagic stellt mit der Pyxis 6K gleich drei leistungsstärkere Vollformat-Versionen seiner Cinema Camera 6K vor, die in ein ...

// 03:40 Sa, 13. Apr 2024von Rob

TOP THEMEN //

zum Forum >>

MEHR NEWS

zum Newsindex >

PASSENDE DISKUSSIONEN

zum Forum >>

Passende Artikel //

Aktuelles

Die Stable Diffusion Revolution: Kostenlose Bildgenerierung per KI jetzt auch auf dem Heim-PC

Seit ein paar Tagen ist es endlich soweit: die Text-zu-Bild KI Stable Diffusion wurde veröffentlicht und kann kostenlos auf dem eigenen Computer genutzt werden - damit ist jetzt ...

// 15:03 Di, 30. Aug 2022von Thomas Richter

Praxis

Stable Diffusion - Tipps und Tricks - Teil 1 - Einrichtung und Einstieg

Unter allen kostenlosen KI-Modellen sticht Stable Diffusion nicht nur durch seine großartige Bildqualität hervor. Es lässt sich sogar auf dem heimischen Rechner installieren...

// 11:52 Fr, 17. Mär 2023von Rudi Schmidts

zur Artikelübersicht >

Was hältst du von den neuen Bild/Video-KIs?
Toll, so viele neue Kreativtools!
Sie werden das Filmemachen vereinfachen
Sie werden das Filmen z.T. ersetzen
Sie werden mich arbeitslos machen
Die sind völlig überbewertet

Ergebnis ansehen

Aktuelle News //

News

Tools für DITs am Set AJA: ColorBox 2.1 ACES-Workflow und DRM2 für das DIT-Cart erklärt

AJA hat spannende neue Werkzeuge für DITs mitgebracht. Wir schauen uns hier u.a. den zertifizierten ACES-Workflow der ColorBox 2.1 und mit dem DRM2 Case eine Lösung für mehr ...

// 15:47 Do, 25. Apr 2024von Rob

News

8x Video-Upscaling VideoGigaGAN - Adobe zeigt generative KI Super Resolution für Bewegtbilder

Unter Super Resolution versteht man Algorithmen, welche die Auflösung eines Bildes künstlich erhöhen können - also mehr Bildinformationen hinzu erfinden, als ursprünglich von ...

// 11:41 Do, 25. Apr 2024von Rudi Schmidts

zur Newsübersicht >