Bild-KI Midjourney V5 liefert fotorealistische Bilder - und endlich auch korrekte Hände

// 12:24 So, 19. Mär 2023von

Midjourney, eine der drei großen bildgenerierenden KIs, hat mit der eben erschienenen neuen (Alpha)Version 5 einen weiteren großen Schritt gemacht: die produzierten Bilder weisen jetzt eine noch viel höhere, fotorealistische Bildqualität auf als bisher und auch die sonst oft störenden kleinen Bildfehler sind beinahe ausgemerzt. Sogar - Trommelwirbel - die lästigen Probleme aller Bild-KIs bei der Darstellung menschlicher Hände, die mal mehr, mal weniger Finger hatten, ist in Midjourney V5 jetzt gelöst.

menschliche Hände - von Midjourney V5 jetzt endlich korrekt von der KI dargestellt
menschliche Hände - von Midjourney V5 jetzt endlich korrekt von der KI dargestellt



Rasender KI-Fortschritt

Dieser Fortschritt spiegelt das momentan rasende Tempo der Entwicklung im Bereich KI wieder: es ist nur knapp 1 Jahr her, dass DALL-E2 die Bühne betrat und als erste Bild-KI demonstrierte, zu was ein solcher Algorithmus sowohl in Bezug auf die Bildqualität und Bildkomposition, als auch auf die "kreative" Umsetzung von komplexen Textprompts fähig war. Die Bilder wiesen zwar oft noch zahlreiche Darstellungsfehler und verschwommene Bereiche auf, aber sie ließen ahnen, welche überraschende Qualität per KI generierte Bildern haben können.


Frühes DALL-E 2 Demobild
Frühes DALL-E 2 Demobild



Bild-KIs im Wettstreit

Seitdem gibt es einen Wettlauf der großen Bild-KIs DALLE-E2, Midjourney und Stable Diffusion, welche ihre Modelle immer weiter optimieren und so ständig bessere Bilder erzeugen. Besonders vielfältig war die Entwicklung bisher bei Stable Diffusion aufgrund seiner offenen Natur, welche schon seit einiger Zeit mit dem passenden Modell fotorealistische Porträts erzeugen kann, auf einem Smartphone lokal läuft und dank ControlNet eine exakte Kontrolle über die Bildkomposition ermöglicht. Hier unser Einführungsartikel Stable Diffusion - Tipps und Tricks - Teil 1 - Einrichtung und Einstieg.



Stable Diffusion plus ControlNet
Stable Diffusion plus ControlNet



Midjourney Version Alpha 5

Doch Midjourney hat jetzt mit der Version 5 wieder vorgelegt - und die anderen Bild-KIs müssen nachziehen. So brilliert Midjourney jetzt besonders bei fotorealistischen Aufnahmen von natürlichen Szenerien und Menschen, die extrem detailreich dargestellt werden und von den Portraits "echter" Menschen nicht mehr unterscheidbar sind. Das berüchtigte Uncanny Valley ist damit (im Fotobereich) endgültig überwunden.



Midjourney V5 Portrait
Midjourney V5 Portrait



Ein Schwerpunkt wurde gelegt auf realistische Hauttexturen samt Unreinheiten und Makeln, welche Gesichter noch natürlicher erscheinen lassen. Möglich sind auch auch Portraits einer Person aus verschiedenen Perspektiven.


Bild-KI Midjourney V5 liefert fotorealistische Bilder - und endlich auch korrekte Hände

Aber auch andere Objekte werden enorm detailreich dargestellt.


Bild-KI Midjourney V5 liefert fotorealistische Bilder - und endlich auch korrekte Hände

So gut wie ausgemerzt sind die bisher typischen KI-Fehldarstellungen von Händen oder Zähnen, anhand derer man bislang noch oft KI Bilder von echten Fotografien unterscheiden konnte. Auch die Abbildung von Schriften ist jetzt besser, allerdings noch immer nicht perfekt und die dargestellten Texte bleiben sinnlos - das könnte sich aber bald ändern, zum Beispiel durch das Zusammenspiel mit einer multimodalen KI wie ChatGPT, welche sowohl mit Bildern als auch mit Texten umgehen kann und Texte in Bildern sowie den Kontext "versteht".


Bild-KI Midjourney V5 liefert fotorealistische Bilder - und endlich auch korrekte Hände

Auch können jetzt Bilder mit vielen neuen Seitenverhältnisse generiert werden. Darstellungsfehler treten dennoch weiterhin auf, etwa sind manchmal Objekte oder Personen - vor allem im Hintergrund - noch manchmal deformiert. Aber auch diese Probleme werden vermutlich bald der Vergangenheit angehören.


Bild-KI Midjourney V5 liefert fotorealistische Bilder - und endlich auch korrekte Hände

Midjourney versteht jetzt auch besser Textanweisungen in natürlicher Sprache, d.h. man muss nicht mehr kryptische Schlüsselwörter aneinanderreihen, um Bildinhalte und Darstellungsstile zu beschreiben. Das Ziel ist laut David Holz, dem Gründer von Midjourney, die Bedienung bedienerfreundlicher zu gestalten. Die aktuelle (Alpha)Version 5 ist nach seinen Worten noch weit von der finalen Version entfernt, es werde noch erhebliche Änderungen geben.



Die Möglichkeit, jetzt noch fotorealistischere und (KI-)fehlerfreie Bilder zu erzeugen, vergrößert zusammen mit der jetzt verbesserten Darstellung von bekannten Persönlichkeiten natürlich das bisher schon bestehende Risiko von Foto-Fakes:


Bild-KI Midjourney V5 liefert fotorealistische Bilder - und endlich auch korrekte Hände





Was kostet Midjourney?

Leider bietet Midjourney keine kostenlosen Bildgenerierungen an - im Gegensatz zu anderen Diensten muss man ein Abo für mindestens einen Monat abschließen. Dieses kostet 10 Dollar pro Monat im Basic Plan, der 200 Bildgenerierungen umfasst bzw. 30 Dollar für den Standard Plan, welcher 15 Stunden schnelle Generierungszeit bietet sowie unbegrenzt viele Bilder im relaxed Modus, welcher etwas länger dauert.


Die Evolution von Midjourney
Die Evolution von Midjourney


Stable Diffusion - die kostenlose Alternative

Es ist damit zu rechnen, dass das quelloffene Stable Diffusion bald mit ähnlichen Verbesserungen nachzieht und so fotorealistische Bilder auf jedem Home-PC (oder sogar Smartphone) kostenlos erzeugt werden können.


Luftaufnahmen per Bild-KI
Luftaufnahmen per Bild-KI


Bild-KI Midjourney V5 liefert fotorealistische Bilder - und endlich auch korrekte Hände


Ähnliche News //
Umfrage
  • Was hältst du von den neuen Bild/Video-KIs?





    Ergebnis ansehen
slashCAM nutzt Cookies zur Optimierung des Angebots, auch Cookies Dritter. Die Speicherung von Cookies kann in den Browsereinstellungen unterbunden werden. Mehr Informationen erhalten Sie in unserer Datenschutzerklärung. Mehr Infos Verstanden!
RSS Suche YouTube Facebook Twitter slashCAM-Slash