Bald für jedermann: Kostenlose Bildgenerierung per KI auf dem Heim-PC

// 10:41 Mo, 15. Aug 2022von Thomas Richter

Der KI-Algorithmus zum Austauschen von Videohintergründen, dem wir gerade eine eigene News gewidmet haben, nutzt als Grundlage zur Bilderstellung die offene bildgenerierende KI Stable Diffusion. Sie wurde von den KI Forschern Patrick Esser und Robin Rombach entwickelt und gerade als geschlossene Beta gestartet. Das Spannendste ist, daß Stable Diffusion schon bald als Software veröffentlicht werden wird, welche auf Consumer-PCs läuft. Es reicht schon eine Grafikkarte mit 5 GB VRAM (wie etwa eine Nvidia GeForce GTX 1660, RTX 2060 oder eine AMD Radeon RX 5600) aus, um 512x512 Pixel große Bilder in wenigen Sekunden zu erzeugen.

So wird die Generierung von Bildern per Text, die bisher nur einem eher engen Kreis von Menschen zugänglich war (oder nur wenige kostenlose Generierungen zuließ), wie etwa per DALL-E 2 und Midjourney), bald für sehr viel mehr Menschen erfahrbar, die damit selbst ohne jede Beschränkung experimentieren können.

Interessant ist in diesem Zusammenhang auch die Aussage von David Holz, dem CEO der Bild-KI Midjourney in einem Interview über die Kosten. Ihm zufolge kostet ein Trainingslauf zum Einlesen eines Pools von Milliarden von Bildern rund 50.000 Dollar und muss meist 10-20 mal wiederholt werden, um zu einem befriedigenden Ergebnis zu kommen. Stable Diffusion trainiert sein Modell mittels 4.000 Nvidia A100 Tensor-Core-GPUs, die jeweils eine Speicherbandbreite von über 2 TB/s besitzen. Sind die Trainingsdaten und damit das Modell erst einmal erstellt, wird viel weniger Rechenleistung benötigt, um den eigentlichen Job auszuführen, also Bilder zu generieren.

Diese Asymmetrie ist typische für neuronale Netzwerke, bei denen viel Rechenpower in das Training gesteckt werden muss, das daraus resultierende spezifische Modell, also das neuronale Netz mit all seinen Gewichtungen der einzelnen Knotenpunkte, dann aber viel weniger Leistung benötigt. Kein Wunder - besteht doch zum Beispiel das für Stable Diffusion verwendete, öffentliche Laion B5 Dataset aus einer 240 TB großen Sammlung von 5 Milliarden Bildern samt mehrsprachigen Bildbeschreibungen (das hier durchsucht werden kann), das für ein Trainingslauf eingelesen und gelernt werden muss. Wir sind jedenfalls gespannt auf die ersten selbst erzeugten Bilder und freuen uns auf die Experimente damit. Bis dahin hier ein schöner Vergleich einiger aktueller bildgeneriernder KIs und ihrer besonderen Stile und zwar DALL-E 2, Stable Duffusion, Crayon, Midjourney und DALL-E Flow.

mehr Infos bei
stability.ai

Auf Socials teilen:

Leserkommentare // Neueste

-paleface- // 00:27 am 16.8.2022

Man kann vermurlich irgendwann unreal engine material per ai zusammen basteln können. Und dann werden auch Filme daraus entstehen.

berlin123 // 15:28 am 15.8.2022

Schauen wir mal was da rauskommt. Als Oldschool Variante gibtd das ja für Groschenromanautoren als Morphologischer Kasten. Man würfelt sich da die Story einfach aus. Aber...weiterlesen

Abercrombie // 14:46 am 15.8.2022

Wird für (Dreh-)Bücher schon dran gearbeitet: http://www.frogs42.com/

Im Forum mitdiskutieren >>

Ähnliche News //

News

VideoFusion: Erste Open Source Video-KI ist da - und läuft auch auf dem Heim-PC

Ein chinesisches Forscherteam hat eine neue Text-to-Video KI veröffentlicht, mit der sich Videos per Texteingabe erzeugten lassen. Ähnliche Algorithmen haben zwar schon Meta mit .....

// 13:41 Mo, 20. Mär 2023von Thomas Richter

News

KI statt Greenscreen: Videohintergründe per Kommandozeile ändern

Wir hatten ja schon berichtet über den KI-gestützen Bildgenerator DALL-E 2 und darüber, daß es nur noch eine Frage der Zeit ist, bis ähnliches auch für Videos verfügbar ist. Nun .....

// 22:37 Sa, 13. Aug 2022von Thomas Richter

News

Whisper: Neue kostenlose KI verwandelt Sprache in Text und übersetzt automatisch in ...

OpenAI, die Entwickler unter anderem der Text-KI GPT3 und der Bildgenerierungs KI DALL-E 2 haben das Spracherkennungssystem "Whisper" vorgestellt, welches nicht nur gesprochene ...

// 15:28 Mo, 26. Sep 2022von Thomas Richter

News

Microsoft bietet ab sofort kostenlose KI-Bildgenerierung per Edge Browser

Microsoft wittert Morgenluft und sieht KI als große Chance, Marktanteile im von Google dominierten Markt der Internet-Suche und -Browser zu erobern - nun wird nach Bing/GPT 4.0 ...

// 15:34 Sa, 8. Apr 2023von Thomas Richter

News

Neuer Algorithmus ermöglicht eigene Objekte in KI-generierten Bildern

In rasendem Tempo geht die Entwicklung der textbasierten Bildgenerierung per KI weiter und ermöglicht immer weitere, praktische Funktionen. So hat jetzt ein Team von Forschern von ...

// 12:59 Do, 15. Sep 2022von Thomas Richter

zur Newsübersicht >

Generative Video-KI-Funktionen Adobe Firefly für Premiere Pro - Generative Extend, Object removal/addition

Zuletzt im Oktober hatte Adobe Firefly-Funktionen für Premiere Pro geteasert, darunter eine Generative Fill-Funktion - nun wird es konkret. Denn noch in diesem Jahr sollen über ...

// 15:08 Mo, 15. Apr 2024von blip

News

Übernahme ist durch RED ist nun eine Nikon-Tochter - und Jarred Land abgesetzt

Rechtzeitig zur NAB gab Nikon bekannt, die Übernahme von RED sei nun zu 100% vollzogen. Ab sofort werden Jarred Land zusammen mit James Jannard nur noch enge Berater der Nikon-...

// 14:13 So, 14. Apr 2024von blip

News

Günstiger und besser? Blackmagic stellt neues DaVinci Resolve Micro Color Panel für 495 Dollar vor

Blackmagic Design hat auf der NAB mit dem DaVinci Resolve Micro Color Panel ein weiteres, besonders erschwingliches Pult für die Farbkorrektur mit DaVinci Resolve angekündigt, ...

// 09:06 Sa, 13. Apr 2024von Rudi Schmidts

News

Blackmagic PYXIS 6K: Die Vollformat "Box"-Kamera mit Viewfinder, 2x SDI, Sideplates (!) uvm.

Am vielseitigsten riggbare Cam Blackmagic PYXIS 6K: Die Vollformat „Box“-Kamera mit Viewfinder, 2x SDI, Sideplates ...

Von vielen seit langem ersehnt und jetzt da: Blackmagic stellt mit der Pyxis 6K gleich drei leistungsstärkere Vollformat-Versionen seiner Cinema Camera 6K vor, die in ein ...

// 03:40 Sa, 13. Apr 2024von Rob

TOP THEMEN //

zum Forum >>

MEHR NEWS

zum Newsindex >

PASSENDE DISKUSSIONEN

zum Forum >>

Passende Artikel //

Aktuelles

Die Stable Diffusion Revolution: Kostenlose Bildgenerierung per KI jetzt auch auf dem Heim-PC

Seit ein paar Tagen ist es endlich soweit: die Text-zu-Bild KI Stable Diffusion wurde veröffentlicht und kann kostenlos auf dem eigenen Computer genutzt werden - damit ist jetzt ...

// 15:03 Di, 30. Aug 2022von Thomas Richter

Aktuelles

Stoppt Mickey Mouse die KI Kunst Revolution? Künstler protestieren gegen KI Konkurrenz

Die neuen bildgenerierenden KIs stellen eine Revolution dar: sie eröffnen erstmals die Möglichkeit, massenhaft hochqualitative Bilder nach Wunsch zu erzeugen - in beliebiger Menge,...

// 14:21 Di, 3. Jan 2023von Thomas Richter

zur Artikelübersicht >

Was hältst du von den neuen Bild/Video-KIs?
Toll, so viele neue Kreativtools!
Sie werden das Filmemachen vereinfachen
Sie werden das Filmen z.T. ersetzen
Sie werden mich arbeitslos machen
Die sind völlig überbewertet

Ergebnis ansehen

Aktuelle News //

News

iPhone: Bester Kamera Monitor? Messevideo: Atomos NINJA PHONE erklärt

Jeromy Young ist zurück als CEO bei Atomos und wir haben ihn auf der NAB 2024 getroffen, um einen ausführlichen Blick auf das neue NINJA PHONE von Atomos zu werfen, das eine ganze ...

// 17:39 Mi, 17. Apr 2024von Rob

News

Höhere Auflösungen Insta360 X4 360°-Action-Kamera filmt in 8K

Die neue Insta360 X4, 360°-Kamera und Action-Kamera in einem, bringt mehrere Verbesserungen gegenüber der X3, wie beispielweise höhere Auflösungen und Framerates sowie einen ...

// 14:11 Mi, 17. Apr 2024von blip

zur Newsübersicht >