Neue Funktion für Bild-KI Midjourney: Bild rein - Prompts raus

Midjourney, die aktuell beste Bild-KI, hat gerade ein bemerkenswertes neues Feature veröffentlicht, nämlich die Möglichkeit, für beliebige Bilder eine Textbeschreibung zu erhalten. Dies lässt erahnen, wie die KI ein Bild sieht. Beschrieben werden sowohl das Bildmotiv als auch der Stil der Darstellung. Doch was macht diese neue "Describe" Funktion so interessant für KI-Künstler?


Zunächst einmal kann so theoretisch jedes erdenkliche Bild per Midjourney (siehe Beispiele unten) "nachempfunden" werden, d.h. die von Midjourney erzeugte Beschreibung eines Bildes funktioniert zugleich auch als Prompt für die Neugenerierung eines - mehr oder weniger - ähnlich Bildes.



Hier ein Eingabe-Bild und die daraus generierten vier alternativen Prompts:


Neue Funktion für Bild-KI Midjourney: Bild rein - Prompts raus

Und hier die Ergebnisse dieser Prompts (von HungryMinded):


Neue Funktion für Bild-KI Midjourney: Bild rein - Prompts raus



Prompts sind keine Geheimnisse mehr

Manche "KI-Künstler" (aka Prompt-Engineers) haben bisher die Prompts ihrer Bilder frei geteilt, andere haben ein Geheimnis daraus gemacht oder sogar Geld dafür verlangt - quasi als Prompt-Künstler. Sie sind der Meinung, dass es sich bei ihren Bildprompts um ein kostbares, durch lange Versuchsreihen destilliertes Wissen handelt, das es ermöglicht, einer bestimmten Bild-KI ganz unverkennbare Bilder zu entlocken - vergleichbar mit der Erfahrung eines bildenden Künstlers.


Neue Funktion für Bild-KI Midjourney: Bild rein - Prompts raus

Damit dürfte jetzt Schluss sein, da die neue "Describe"-Funktion auch zum Reverse-Engineering taugt und oftmals die Prompts enthüllt, mit denen ein Bild - falls es per KI erzeugt wurde - generiert wurde. Allerdings funktioniert das nicht 1:1 - es ist einiges an Unschärfe vorhanden, sodass z.B. selbst ein per Midjourney erzeugtes Bild per Describe nicht das exakte Ur-Prompt ausgibt, sondern nur ähnliche - manchmal ist auch das neu erzeugte Bild ganz anders.






Variation

Midjourney liefert pro Bild vier leicht variierende Beschreibungen, welche per Klick auch gleich zur Generierung von darauf basierenden Bildern genutzt werden können. So können - ähnlich wie bei Stable Diffusions Reimagine / unCLIP einfach Variationen eines beliebigen Bildes erzeugt werden - sei es, um schönere Versionen zu finden oder natürlich auch um ein Copyright zu umgehen und geschützte Bilder einfach - genügend ähnlich, aber nicht zu exakt - nachzuahmen.



Variationen auf ein Bild - von HungryMinded:


Neue Funktion für Bild-KI Midjourney: Bild rein - Prompts raus


Zudem sieht man anhand der erzeugten Prompts gut, wie sich die verschiedenen Parameter der Prompt-Varianten jeweils auf die Bilder auswirken und kann einzelne Darstellungsparameter ändern, zum Beispiel um ganz gezielte Variationen zu erzeugen.



Beispiel von Ethan Mollick mit überraschenden Bildstilen wie "neue Sachlickeit" und "daguerrian":


Neue Funktion für Bild-KI Midjourney: Bild rein - Prompts raus



Einblick in den Latent Space

Eine weiterer Aspekt von "Describe" ist der Einblick, der in das Innenleben von Midjourney, d.h. den multidimensionalen Latent Space, gewährt wird und der offenbart, was Midjourney in einem Bild "sieht". Dabei sind manche Ausgaben oft überraschend - wer hätte das folgenden Bild, ein Filmstill aus dem populären Hollywood Alpen-Musicalfilm "Sound of Music", etwa mit "made of insects" und "grandparentcore" assoziiert? Das Beispiel stammt von Ethan Mollick, das vollständige von Describe erzeugte Prompt lautet: "a womans open arms, in the style of bold chromaticity, made of insects, mountainous vistas, grandparentcore, joyful and optimistic, unearthly, movie still".


Sound of Music
Sound of Music



Besser Prompten lernen

Anhand der erzeugten Bildbeschreibungen kann man auch gut seine eigenen Prompting-Skills verbessern - man sieht, welche Parameter - laut Midjourney selbst - ein Bild in allen seinen Dimensionen definieren. Interessant ist, dass die Describe Ergebnissen oft auch Künstlernamen nennen, um einen Darstellungsstil oder eine Bildstimmung zu beschreiben. Und man lernt neue Parameter - Bildstil, Objektbeschreibungen oder Künstler betreffend - kennen, die man vielleicht bisher nicht als relevant (oder existent) auf dem Schirm hatte.


Ähnliche News //
Umfrage
  • Was hältst du von den neuen Bild/Video-KIs?





    Ergebnis ansehen
slashCAM nutzt Cookies zur Optimierung des Angebots, auch Cookies Dritter. Die Speicherung von Cookies kann in den Browsereinstellungen unterbunden werden. Mehr Informationen erhalten Sie in unserer Datenschutzerklärung. Mehr Infos Verstanden!
RSS Suche YouTube Facebook Twitter slashCAM-Slash